1、AI三要素中,数据稀缺性明显

天风研究:AI核心三要素中数据稀缺性明显_数据_模子 科技快讯

算法、算力、数据是AI核心三要素,当前AI大模型的演习,算法端向神经网络Transformer模型收敛,算力端依赖具备大规模并行打算能力的AI做事器集群,数据端则须要巨大数据量的大规模数据集投喂,我们认为AI三要素中数据是直接影响AI大模型在垂直行业落地效果的关键,而垂类数据常日由政府和行业机构节制,比较于模型和算力,数据稀缺性明显。
目前通用大模型的演习数据集多来自互联网文本数据,例如ChatGPT演习数据集来自维基百科、互联网***、社交媒体、电子书等。
彭博社发布了针对金融领域的大型措辞模型BloombergGPT,演习采取51.27%金融信息数据和48.73%的公共数据,在500亿参数规模下,BloombergGPT对金融任务效果好于通用大模型。

2、北京、深圳相继发布AI支持政策,强调公共数据开放

5月30日,《北京市加快培植具有环球影响力的人工智能创新策源地履行方案(2023-2025年)》发布,提到“加强公共数据开放共享”、“加快构建高质量人工智能演习数据集,研究建立数据集开放共享机制”;5月31日,《深圳市加快推动人工智能高质量发展高水平运用行动方案(2023-2024年)》,提到“造就高质量数据要素市场”、“2023年年底前出台公共数据开放管理办法、公共数据资源目录,制订公共数据开放操持”。

3、数据要素是数字经济核心引擎,进入加速落地阶段

数据是数字经济时期新型生产要素,是数字经济深化发展的核心引擎。
2022年12月,《中共中心***关于构建数据根本制度更好发挥数据要素浸染的见地》发布,2023年3月,国家数据局成立,顶层框架文件+管理机构落地,数据要素进入加速落地阶段。
2023年以来遍地所积极推进数据要素落地,例如:2023年2月,《杭州市公共数据授权运营履行方案(试行)》(搜聚见地稿)发布;4月,广东省政务做事数据管理局局长在“2023数字经济峰会”主题发言中透露,《广东省数据条例》即将出台,广东研究将数据生产要素纳入国民经济核算体系,广州海珠、深圳南山已获批开展数据生产要素统计核算试点。

建议关注:

1)国家云:深桑达A、中国电信(通信组覆盖)、品高股份

2)数据产品做事商:中科江南、上海钢联、通畅宝、海天瑞声、中远海科

3)数据平台与安全:安恒信息、启明星辰、信安世纪、三维天地、普元信息

4)垂直行业AI运用:科大讯飞、同花顺、中科软、恒生电子、顶点软件、新致软件

风险提示:

本文源自券商研报精选