人工智能≠机械人:激活根本模型在家当的巨大应用潜力和商业价值_模子_家当
“人工智能根本模型(Foundation Models),也便是人们常说的大措辞模型(Large Language Models)或大模型,在不同家当具有巨大的运用潜力,但一些企业和机构对付人工智能大模型的运用办法,还局限在智能客服、对话机器人,或者笔墨、图片天生等方面。事实上,根本模型拥有强大的推理、天生和泛化能力,适用于家当界中最具商业代价的任务,如精准预测和掌握、高效优化决策,以及智能化、可交互的工业仿照。”
——边江 微软亚洲研究院资深首席研究员
随着人工智能大模型(根本模型)的发展,很多企业和机构都对其在生产力场景中的运用表现出极大的激情亲切。不过,我们也不雅观察到这样一个征象:很多家当从业者彷佛更关注人工智能靠近“人”的一壁——像人类一样对话、写作、创作,以及拥有近似于人类的感知能力。比如,很多企业在引入人工智能大模型时,首选场景都方向于智能客服,对话机器人等“类人”岗位。毫无疑问,这种方向存在着对大模型理解和运用上的局限,并不能让它在家当界发挥出应有的潜力。
然而,这些局限有其一定性。由于根本模型与生产场景的领悟还缺少成熟且普遍的先例。如果把人工智能看作一种“生产工具”,那么它的运用就类似于“先有工具再发掘用场”,而且人类历史上可能从未有过这种不针对特定需求,而是有着广泛用场但又存在不愿定性的工具。
此外,由于不同家当存在更加丰富、繁芜的场景,适用于家当界相应场景的根本模型,与常日意义上的根本模型也不尽相同。这就须要对家昔时夜模型进行同步创新,在更多家就地景中充分发挥根本模型的能力,实现人工智能与运用处景的匹配。对付各个家当来说,我们不妨从摆脱思维局限开始,不要将人工智能等同于机器“人”。然后,重新核阅和改变现有的业务流程和业务架构,梳理出适应人工智能时期的人与根本模型的互助模式。
根本模型在家当界潜力无限
根本模型是具有通用的数据表示能力、知识理解能力和推理能力的人工智能模型,可以在不同的领域和场景中自然迁移,并快速适应新的环境。与此同时,家当界的数字化平台在经由多年的发展后,已经积累了大量的行业数据,为根本模型供应了更丰富和更适用于特定场景的知识和信息——这让根本模型有了融入家就地景的根本。
在运用代价方面,根本模型强大的推理能力,能够帮助利用者更好地理解数据,从海量的数据中提取有代价的信息,创造数据之间的关联和规律,从而供应更深刻的洞察和更有效的建议。这一上风可以在家当领域的预测、决策、仿照等场景中发挥关键浸染。
根本模型的另一个上风是泛化能力。在根本模型涌现之前,每个行业场景都须要利用特天命据来演习一个专属人工智能模型,这难以大规模复用,限定了人工智能的商业代价,而基于全天下通用知识演习的根本模型,极大地提升了模型的泛化能力,让家当界不再须要像传统人工智能办理方案那样,为每个场景演习专属模型。
根本模型还可以和天生式人工智能结合,提升工业仿真和智能仿照的准确性、真实性与可交互性,促进数字孪生的实现。工业仿真和仿照都是对真实天下的还原和测试,涉及浩瀚繁芜的角色和环境。传统人工智能模型难以支撑大规模仿真,仿照时每每会简化真实情形,或忽略主要的极度事宜,影响了仿照和仿真的质量和真实性。天生式人工智能大模型能够支持更广泛的场景,在深入学习特定领域专业知识的根本上,建立特天命据维度分布与真实事宜的映射,实现靠近现实天下的仿照,更好地赞助工业预测与决策任务,达到工业运用标准。
根本模型在家当界落地须要战胜四个难题
在家当界,最主要也最有商业代价的任务包括精准预测和掌握,高效优化决策,以及智能化、可交互的工业仿照等繁芜任务。这些领域也是传统行业企业该当重点关注的运用方向。然而,通过对现有的 GPT 等根本模型的评测,并结合家当领域的实际情形,我们创造根本模型与真实家当需求之间还存在明显差距,须要战胜多少难题,才能使其在家当界发挥更大的浸染。
首先,我们缺少一个能够从纷繁的领域数据中理解繁芜领域知识,且可以基于领域知识来构建智能体的通用框架。不同的领域具有各自丰富且繁芜的数据,例如物流企业中的海关信息、跨国政策等干系信息;医药行业中 FDA(食品药品监督管理局)药物审查文档;法律行业中的各种法规文档等。构建基于领域知识的智能体须要更通用的框架,从这些数据中提炼出主要的领域知识,创造数据和知识之间的隐含关联,并对它们进行有效的组织和管理。
其次,在文本数据之外,根本模型对构造化数据的处理和理解能力较弱。目前的根本模型最善于的还是纯文本内容的天生和创作,部分模型也能处理图像、语音等数据。但是,工业场景中的数据每每是数值型、构造化的,如康健监测指标、电池充放电旗子暗记、金融信用行为等时序数据或表格数据。现有的大模型还没有针对这类数据进行特定的设计和优化,不能充分理解并处理这些数据,因此很难精准的完成基于这类数据的预测和分类任务。
第三,从运用层面来看,根本模型的决策能力不足稳定和可靠。能源、物流、金融、康健等关键家就地景中最主要的每每是决策类任务,包括物流路径优化、能耗设备掌握、投资策略制订、医疗资源调度等,这些任务每每涉及多个变量和多个约束,特殊是当面对动态变革的环境时,根本模型还没有完备适应这些繁芜的任务,无法直接在家当领域运用。
末了,我们还缺少对一些特定领域的根本数据的洞察,以及构建特定领域根本模型的方法和履历。很多特定领域的核心信息并不是纯挚的文本,因此他们的根本数据也不再是文本中的字和词,而是包含独特的语义构造和关系的新型根本数据,例如金融投资行业中的交易订单信息;生物医药行业中的分子构造信息等,干系领域的核心知识每每隐含在这一类根本数据中,须要更深入和更细致的剖析。只有在此根本上构建特定领域的根本模型,才能更有效地挖掘和开释数据的潜力。
构建家当根本模型:领悟通用知识与领域专业知识
为了推动根本模型在家当界更快地落地和运用,我们可以着重从以下几个方面入手:
首先,我们可以利用丰富和繁芜的家当领域数据,构建更通用、高效和实用的检索增强天生(RAG)框架,可以适配各个垂直领域,帮助提炼出主要的领域知识,创造数据和知识之间的隐含关联,并对它们进行有效的组织和管理。
基于根本模型的更通用、高效和实用的检索增强天生(RAG)框架
其次,基于工业场景中主要的数值数据和相应的构造化依赖,构建适宜家当化的根本模型,通过有效领悟通用知识和时序数据或表格数据中的领域知识,更有效地办理家傍边的预测、分类等任务。
从传统人工智能的家当办理方案到领悟通用与领域知识的家当根本模型
另一个我们目前正在着重探索的方向:利用根本模型已具备的强大的天生、泛化和迁移能力,提高家当决策的质量和效率。在这方面,我们在探索两种路径,一是将根本模型作为一个智能体,二是让根本模型赞助强化学习智能体。
将根本模型作为一个智能体:我们可以利用根本模型的先验知识,结合离线强化学习(Offline Reinforcement Learning),通过持续网络新的领域知识并不断微调,促进智能体的进化,提高作为智能体的根本模型的优化决策能力,使其能更专注于处理家当领域内的任务。
协同根本模型与离线强化学习构建决策智能体
经由优化的根本模型可以在多种家就地景中发挥浸染。例如,在方程式赛车中,该根本模型能够优化赛车的轮胎维修策略,根据赛车轮胎的损耗和维修本钱,找到最佳的进站维修韶光,以缩短赛程、提高赛车排名;在化工企业的产品调度中,利用这一根本模型可以大幅提高产品存储与生产过程中管线协同的效率,从而提升生产实行效率;其余,基于根本模型的泛化能力与鲁棒性,还可以将其快速迁移至空调掌握优化的场景中,在担保舒适温度的同时实现能耗最小化。
利用根本模型赞助强化学习智能体:我们可以让模型学习通用表示,在不同的环境和任务中快速适应,从而提升泛化能力。在这一方法中,我们引入了预演习天下模型(Pretrained World Model),它可以仿照人类的学习和决策过程,增强家当决策的效果。通过利用具有广泛知识的预演习天下模型,并采取两阶段预演习框架,开拓者能够更全面和灵巧地演习根本模型进行家当决策,并将其扩展到任何特定的决策场景。
我们与微软 Xbox 团队互助,在游戏测试的场景中验证了这个框架的有效性。我们利用该框架针对游戏舆图预演习了天下模型,办理了在新游戏场景中利用地标不雅观察进行长期空间推理或导航的问题。该预演习模型明显优于没有天下模型或利用传统学习方法的模型,极大地提高了游戏探索的效率。
此外,我们还可以利用领域内专有的根本数据和所蕴含的特定语义信息,打造领域内的根本模型,为智能可交互的决策和仿照开拓新的可能性。比如,我们可以基于金融市场交易订单数据构建金融投资根本模型,这些根本数据是包含丰富语义构造和信息的交易订单,而不是纯文本字符。基于这一金融根本模型,我们可以实现针对不同市场风格的订单流天生,仿照不同市场环境下的大规模订单交易,实现对金融投资市场的可控仿照,从而更好地理解市场变革的规律,探索应对极度场景的策略。
基于金融根本模型实现针对不同市场风格的订单流天生,从而仿照多样的市场环境
根本模型引领家当数字化转型的下一波浪潮
很早之前,微软亚洲研究院就已经意识到人工智能在家当界的广泛运用须要新的技能探索、考试测验和打破,通过跟来自不同家当的互助伙伴互助,我们陆续研发出 Qlib 人工智能量化投资平台、MARO 多智能体资源优化平台、FOST 时空预测工具、BatteryML 电池性能剖析与预测平台等开源模型。这些面向家当的人工智能平台、工具和模型,不仅在工业界发挥了主要浸染,也为目前根本模型的家当落地供应了主要的数据和工具根本。
借鉴成功的人工智能家当化履历,我们已经开始从前文先容的几个维度深入探索面向工业领域的人工智能根本模型及其运用。我们创造,在这些打破传统大模型认知的维度上,根本模型拥有巨大潜力,能够深刻促进家当变革。
可以想象,未来根本模型将能够帮助家当界实现行业内的知识自动管理、自动提取、自动迭代。在此之外,我们也在探索根本模型帮助企业实现自动研发,包括研发方向的自动发掘、算法研究方案的自动天生、研发过程和科学实验的自动天生和实行,以及研究思路的自动迭代。换言之,人工智能将能够自主进行数据驱动的家当化研发,这将深刻改变家当界的运作模式。
研发智能体:自动演进以工业数据为中央的研发周期
根本模型将是继互联网和云打算之后,加速家当数字化转型的新动力,并将带来新一波的家当创新爆发。我们期待与更多家当界的互助伙伴一起,深入真实场景,探索根本模型在家当领域运用的更多可能性,充分开释根本模型的商业代价。
本文作者
边江博士,现任微软亚洲研究院资深首席研究员、微软亚洲研究院机器学习组和家当创新中央卖力人,所带领的团队研究领域涉及深度学习、强化学习、隐私打算等,以及人工智能在金融、能源、物流、制造、医疗康健、可持续发展等垂直领域的前沿性研究和运用。
边江博士曾在国际顶级学术会媾和期刊上揭橥过上百篇学术论文,并得到数项美国专利。他曾是多个国际顶级学术会议程序委员会成员,并担当多个国际顶级期刊审稿人。过去几年,他的团队成功将基于人工智能的预测和优化技能运用到金融、物流、医疗等领域的主要场景中,并将干系技能和框架发布到开源社区。
边江博士本科毕业于北京大学,获打算机科学学士学位,之后在美国佐治亚理工学院深造,获打算机科学博士学位。
干系模型开源链接:
Qlib 人工智能量化投资平台
https://www.msra.cn/zh-cn/news/features/qlib-2
MARO 多智能体资源优化平台
https://github.com/microsoft/maro
FOST 时空预测工具
https://github.com/microsoft/FOST
BatteryML 电池性能剖析与预测平台
https://github.com/microsoft/BatteryML
本文系作者个人观点,不代表本站立场,转载请注明出处!