AI技能成长新难题:互联网信息不足用了数据缺少或阻碍AI技能进步【附人工智能行业成长趋势分析】_数据_人工智能
人工智能(AI)公司OpenAI再放“大招”!
当地韶光4月1日,OpenAI宣告,将许可用户直策应用ChatGPT,而无需注册该项做事,这将让人们更加随意马虎体验人工智能的潜力。OpenAI表示,它将从周一开始逐步推出这一功能,让185个国家和地区的超1亿用户利用ChatGPT来学习新事物、探求创意灵感,并得到问题的答案。
自ChatGPT问世以来,它的强大功能不断改变着人们的事情与生活办法,迅速成为用户增长最快的运用程序。然而,近期据Similarweb的数据显示,自2023年5月ChatGPT环球访问量达到18亿次的顶峰后,其流量增长开始逐渐放缓。
面对这一寻衅,OpenAI决定放宽对ChatGPT的限定,让更多人无需注册即可利用。这背后,反响了人工智能发展的困境——现有的互联网信息量可能不敷以支撑科技巨子演习更高等的人工智能系统,乃至高质量文本数据的匮乏可能阻碍AI技能的进步。
面对互联网信息不敷的问题,OpenAI正在考虑用YouTube***里的对话来演习它们的下一代智能模型GPT-5。有的公司乃至创造合成数据来学习,只管这种方法被许多研究职员认为可能会导致系统发生严重故障,但不失落为战胜数据短缺的一种潜在路子。
据Epoch研究所的AI研究员Pablo Villalobos估计,GPT-4演习涉及的数据量高达12万亿tokens,而未来模型,如GPT-5,可能须要60万亿到100万亿tokens。因此,即便是利用所有可用的高质量措辞和图像数据,研发GPT-5仍可能面临10万亿到20万亿tokens的数据短缺。至于如何填补这一巨大的数据缺口,目前尚无明确方案。
针对数据短期问题,Meta也提出应对方案,其创始人扎克伯格近期强调,公司通过Facebook和Instagram等平台拥有的大量数据,为其AI研发供应了主要上风。扎克伯格表示,Meta能够利用网络上数以百亿计的公开共享图片和***,这些数据的规模超过了大多数常用数据集,只管个中高质量数据的比例尚不明确。
从“AI技能面临数据短缺难题”回看人工智能行业发展情形:
——人工智能市场规模情形
受益于国家政策的支持,以及成本和人才的驱动,我国人工智能家当发达发展,已步入天下前列。根据中国信通院发布的数据,我国人工智能家当规模从2019年开始快速增长,2021年同比增长达到33.3%,2022年家当规模达到5080亿元,同比增长18%。初步统计,2023年规模达到5784亿元,增速放缓至13.9%。
——AI大模型是一种新的智能打算范式
超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能打算范式。和传统AI模型比较,大模型的演习利用了更多的数据,具有更好的泛化性,可以运用到更广泛的下贱任务中。按照运用处景划分,AI大模型紧张包括措辞大模型、视觉大模型和多模态大模型等。业界范例的自然措辞大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛运用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技能也迅速发展,AI内容天生(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。
——合成数据为AI模型演习开拓供应强大助推器
合成数据是打算机仿照技能或算法创建、天生的自标注信息,可以在数学上或统计学上反响真实天下数据的属性,因此可以作为真实天下数据的替代品,来演习、测试、验证AI模型。目前人工智能仍处于1.0阶段,数据是最大阻碍,但合成数据将有效助推人工智能走向2.0阶段。
——合成数据加速构建AI赋能、数实结合的大型虚拟天下
合成数据指向的终极运用形态是借助游戏引擎、3D图形、AIGC技能构建的大型虚拟天下。大虚拟天下对付人工智能的核心代价在于,为测试。开拓新的人工智能运用供应了一个安全、可靠、高效以及最主要的——低本钱、可重复利用的环境。展望未来,可从三个方面来理解大型虚拟天下为什么会成为AI数实结合的关键场景。
两年前,据Epoch研究所的AI研究员Pablo Villalobos预测,到2024年年中,对高质量数据的需求超过供给的可能性为50%,到2026年发生这种情形的可能性为90%。自那往后,他们变得更加乐不雅观,在AI研究员Pablo Villalobos及其团队的谨严评估下,新的预期显示,这种短缺风险将延迟至2028年。
这项乐不雅观的更新基于对当前数据质量和可用性的深刻洞察。Villalobos指出,互联网上的绝大多数数据并不适宜作为AI演习材料。在无尽的信息流中,只有一小部分数据(远低于先前估量)能对AI模型的增长和发展做出本色性贡献。
前瞻经济学人APP资讯组
更多本行业研究剖析详见前瞻家当研究院《中国人工智能行业发展前景预测与投资计策方案剖析报告》。
同时前瞻家当研究院还供应家昔时夜数据、家当研究报告、家当方案、园区方案、家当招商、家当图谱、聪慧招商系统、行业地位证明、IPO咨询/募投可研、IPO事情底稿咨询等办理方案。在招股解释书、公司年度报告等任何公开信息表露中引用本篇文章内容,须要获取前瞻家当研究院的正规授权。
更多深度行业剖析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员互换互动。更多企业数据、企业资讯、企业发展情形尽在【企查猫APP】,性价比最高功能最全的企业查询平台。
本文系作者个人观点,不代表本站立场,转载请注明出处!