人工智能的三大年夜基石:数据、算力和算法—座谈人工智能(番外篇)_算法_数据
——漫谈人工智能(番外篇)
文/陈思进
近年来人工智能(以下简称“AI”)发展迅速并日益受到重视,日前中国信息通信研究院发布的《环球人工智能计策与政策不雅观察(2020)》报告中指出,截止2020年12月尾,环球已有39个国家和地区制订了AI的计策政策、家当方案文件。本篇文章作为AI科普系列文章中的番外篇,紧张向大家先容AI三大核心要素(也是AI的三大基石)——数据、算力和算法。
数据是AI算法的“饲料”
在如今这个时期,无时无刻不在产生数据(包括语音、文本、影像等等),AI家当的飞速发展,也萌生了大量垂直领域的数据需求。在AI技能当中,数据相称于AI算法的“饲料”。机器学习中的监督学习(Supervised Learning)和半监督学习(Semi-supervised Learning)都要用标注好的数据进行演习(由此催生大量数据标注公司,对未经处理的低级数据进行加工处理, 并转换为机器可识别信息),只有经由大量的演习,覆盖尽可能多的各种场景才能得到一个良好的模型。
目前,数据标注是AI的上游根本家当,以人工标注为主,机器标注为辅。最常见的数据标注类型有五种:属性标注(给目标工具打标签)、框选标注(框选出要识别的工具)、轮廓标注(比框选标注更加详细,边缘更加精确)、描点标注(标注出目标工具上细致的特色点)、其他标注(除以上标注外的数据标注类型)。AI算法须要通过数据演习不断完善,而数据标注是大部分AI算法得以有效运行的关键环节。
算法是AI的背后“推手”
AI算法是数据驱动型算法,是AI背后的推动力量。
主流的算法紧张分为传统的机器学习算法和神经网络算法,目前神经网络算法由于深度学习(源于人工神经网络的研究,特点是试图模拟大脑的神经元之间通报和处理信息的模式)的快速发展而达到了高潮。
南京大学打算机系主任、人工智能学院院长周志华教授认为,本日“AI热潮”的涌现紧张由于机器学习,尤其是机器学习中的深度学习技能取得了巨大进展,并在大数据和大算力的支持下发挥巨大的威力。
当前最具代表性深度学习算法模型有深度神经网络(Deep Neural Network,简称DNN)、循环神经网络(Recurrent Neural Network,简称RNN)、卷积神经网络(Convolutional Neural Network,简称CNN)。谈到深度学习,DNN和RNN便是深度学习的根本。DNN内部的神经网络层可以分为三类,输入层,隐蔽层和输出层, 一样平常来说第一层是输入层,末了一层是输出层,而中间的层数都是隐蔽层。DNN可以理解为有很多隐蔽层的神经网络,是非常弘大的系统,演习出来须要很多数据、很强的算力进行支撑。
算力是根本举动步伐
AI算法模型对付算力的巨大需求,推动了本日芯片业的发展。据OpenAI测算,2012年开始,环球AI演习所用的打算量呈现指数增长,均匀每3.43个月便会翻一倍,目前打算量已扩大30万倍,远超算力增长速率。
在AI技能当中,算力是算法和数据的根本举动步伐,支撑着算法和数据,进而影响着AI的发展,算力的大小代表着对数据处理能力的强弱。算力源于芯片,通过根本软件的有效组织,终极开释到终端运用上,作为算力的关键根本,AI芯片的性能决定着AI家当的发展。
加快补齐AI芯片短板
从技能架构来看,AI芯片可以分为四大类:通用性芯片(GPU,特点是具备通用性、性能高、功耗高)、半定制化芯片(FPGA,特点是可编程、功耗和通用性一样平常)、全定制化芯片(ASIC,特点是不能扩展、性能稳定、功耗可控)和类脑芯片(特点是功耗低、相应速率快)。
AI实质上是利用人工神经网络对人脑进行的仿照,旨在替代人们大脑中的生物神经网络。由于每个任务对芯片的哀求不同,以是可以利用不同的AI芯片进行演习和推理。
在过去二十年当中,处理器性能以每年大约55%的速率提升,内存性能的提升速率每年只有10%旁边,存储速率严重滞后于处理器的打算速率。随着AI技能的发展,所需数据量变得越来越大,打算量越来越多,“内存墙”(指内存性能严重限定CPU性能发挥的征象)的问题越来越严重。因此,存算一体(将部分或全部的打算移到存储中,打算单元和存储单元集成在同一个芯片,在存储单元内完成运算)有望成为办理芯片性能瓶颈及提升效能比的有效技能手段。
目前,数据中央中核心算力芯片各种通用的GPU占主导地位。IDC的研究指出,2020年,中国的GPU做事器霸占95%旁边的市场份额,是数据中央AI加速方案的首选。但IDC也做出预测,到2024年,其他类型加速芯片的市场份额将快速发展,AI芯片市场呈现多元化发展趋势。
近些年来,我国AI虽然取得了不少的打破和进展(例如小i机器人主导了环球第一个AI情绪打算的国际标准),并在国际上具备一定的竞争力,但AI芯片对外依赖较大(根据赛迪智库人工智能家当形势剖析课题组研究指出,海内AI芯片厂商须要大量依赖高通、英伟达、AMD等国际巨子供货),并缺少AI框架技能(深度学习主流框架TensorFlow、Caffe等均为美国企业或机构节制)的支撑。
未来人们对科技的依赖会进步神速,AI也将会成为大国竞争的焦点。为摆脱我国AI的短板,有专家表示AI芯片方面我国可以借鉴开源软件成功履历,降落创新门槛,提高企业自主能力,发展国产开源芯片;算法框架方面则可通过开源形成广泛的运用生态,广泛支持不同类型的AI芯片、硬件设备、运用等。
算法、算力、数据作为AI核心三要素,相互影响,相互支撑,在不同行业中形成了不一样的家当形态,随着算法的创新、算力的增强、数据资源的累积,传统根本举动步伐将借此东风实现智能化升级,并有望推动经济发展全要素的智能化改造,让人类社会从信息化进入智能化。
(思进注:除注明作者之外,所有文章皆为思进原创。【免责声明】本文仅代表原作者个人的论述和不雅观点,敬请读者自行判断。内容或者数据仅供参考,不构成任何详细投资建议、不作任何商业用场、更不对其真实性卖力。投资者据此操作,风险自担。)
本文系作者个人观点,不代表本站立场,转载请注明出处!