通知布告|国家自然科学基金委员会宣告可解释、可通用的下一代人工智能方法重大年夜研究计划2024年度项目指南_人工智能_模子
国科金发计〔2024〕113号
国家自然科学基金委员会现发布可阐明、可通用的下一代人工智能方法重大研究操持2024年度项目指南,请申请人及依托单位按项目指南所述哀求和把稳事变申请。
国家自然科学基金委员会
2024年3月14日
可阐明、可通用的下一代人工智能方法重大研究操持2024年度项目指南
可阐明、可通用的下一代人工智能方法重大研究操持面向人工智能发展国家重大计策需求,以人工智能的根本科学问题为核心,发展人工智能新方法体系,促进我国人工智能根本研究和人才培养,支撑我国在新一轮国际科技竞争中的主导地位。
一、科学目标
本重大研究操持面向以深度学习为代表的人工智能方法鲁棒性差、可阐明性差、对数据的依赖性强等根本科学问题,挖掘机器学习的基本事理,发展可阐明、可通用的下一代人工智能方法,并推动人工智能方法在科学领域的创新运用。
二、核心科学问题
本重大研究操持针对可阐明、可通用的下一代人工智能方法的根本科学问题,环绕以下三个核心科学问题开展研究。
(一)深度学习的基本事理。
深入挖掘深度学习模型对超参数的依赖关系,理解深度学习背后的事情事理,建立深度学习方法的逼近理论、泛化偏差剖析理论和优化算法的收敛性理论。
(二)可阐明、可通用的下一代人工智能方法。
通过规则与学习结合的办法,建立高精度、可阐明、可通用且不依赖大量标注数据的人工智能新方法。开拓下一代人工智能方法须要的数据库和模型演习平台,完善下一代人工智能方法驱动的根本举动步伐。
(三)面向科学领域的下一代人工智能方法的运用。
发展新物理模型和算法,培植开源科学数据库、知识库、物理模型库和算法库,推动人工智能新方法在办理科学领域繁芜问题上的示范性运用。
三、2024年度帮助研究方向
(一)造就项目。
环绕上述科学问题,以总体科学目标为牵引,对付探索性强、选题新颖、前期研究根本较好的申请项目,将以造就项目的办法予以帮助,研究方向如下:
1.神经网络的新架构和新的预演习或自监督学习方法。
针对图像、***、图、流场等数据,发展更高效的神经网络新架构,预演习或自监督学习方法,并在真实数据集上进行验证。
2.深度学习的表示理论和泛化理论。
研究卷积神经网络(以及其它带对称性的网络)、图神经网络、循环神经网络、低精度神经网络、动态神经网络、天生扩散模型等模型的泛化偏差剖析理论、鲁棒性和稳定性理论,并在实际数据集上进行验证;研究无监督表示学习、预演习-微调范式等方法的理论根本,发展新的泛化剖析方法,辅导深度学习模型和算法设计。
3.深度学习演习算法的理论根本。
研究神经网络丢失景不雅观的构造和演习算法的特性,包括但不限于:临界点的分布及其嵌入构造、极小点的连通性,稳定性边缘(edge of stability)和丢失尖峰(loss spike)征象、算法的隐式正则化、稳定性和收敛性;演习过程对付超参的依赖性问题、神经网络影象灾害、演习韶光繁芜度剖析等问题;发展卷积网络、Transformer网络、扩散模型、稠浊专家模型等模型的收敛速率更快、韶光繁芜度更低的演习方法。
4.大模型的根本问题。
研究多任务、多数据、大模型的根本问题,包括但不限于大模型的表示理论和泛化理论、大模型演习的稳定性、标度率(scaling law)、呈现等征象;研究新型 (structured) state model的根本性子,包括它是否有影象灾害(curse of memory)的困难;理解Transformer模型的表达和泛化能力、高下文学习(In-Context learning),Chain of Thoughts推理的有效性,以及模型的外推能力(例如length generalization)等。
5.微分方程与机器学习。
研究求解微分方程正反问题及解算子逼近的概率机器学习方法;基于天生式扩散概率模型的物理场天生、仿照与补全框架;基于微分方程设计新的机器学习模型和网络构造,加速模型的推理、剖析神经网络的演习过程。
6.图神经网络的新方法。
利用随机游走、多项式近似、调和剖析、粒子方程等数学理论办理深度图神经网络过度光滑、过度挤压、适用异配图与动态图等问题;针对药物设计、推举系统、多智能体网络协同掌握等主要运用处景设计有效的、可扩展的、具有可阐明性的图表示学习方法。
7.人工智能的安全性问题。
针对主流机器学习问题,发展隐私保护协同演习和预测方法;发展面向对抗样本、数据投毒、后门等剖析、攻击、防御和修复方法;研究机器学习框架对模型滋扰、毁坏和掌握的方法;发展可控精度的隐私打算方法,数据和模型(包括大模型)的公正性、可靠性的评估与评级方法。
8.科学打算领域的人工智能方法。
针对电子多体问题,建立薛定谔方程数值打算、第一性事理打算、自由能打算、粗粒化分子动力学等的人工智能方法,探索人工智能方法在电池、电催化、合金、光伏等体系研究中的运用。
针对范例的物理、化学、材料、生物、燃烧等领域的跨尺度问题和动力学问题,发展物理模型与人工智能的领悟方法,探索繁芜体系变量隐含物理关系的挖掘方法和构效关系的数学表达,建立具有通用性的跨尺度人工智能赞助打算理论和方法,办理范例繁芜多尺度打算问题。
9.以数据为中央的机器学习。
针对数据质量、数量和效率等成分,发展机器学习方法为下贱机器学习模型供应大量高质量数据;针对AI for Science数据侧,研究和设计高效的科学数据(如对蛋白质和药物构图)构建和预处理办法;针对大模型数据侧,从数据获取本钱和效率出发,建立科学和系统的数据质量评估策略,设计高效的数据选择方法,构建有效的数据配比方式,并探索大模型赞助数据质量提升的方法(如自动数据标注)。
10.基于量子打算的机器学习算法。
研究不同类型的学习方法如何映射到一样平常的量子过程,提出新算法利用量子特性实现高效学习;研究量子机器学习相对付经典机器学习方法在表达能力以及泛化能力上的上风,探索量子机器学习的可阐明性,建立量子机器学习在量子物理和化学的运用处景。
11.开放型项目。
与可阐明、可通用的下一代人工智能方法和AI for Science 领域干系的方法,重点支持在算法和模型方面的创新课题。
(二)重点支持项目。
环绕核心科学问题,以总体科学目标为牵引,拟以重点支持项目的办法帮助前期研究成果积累较好、对总体科学目标在理论和关键技能上能发挥推动浸染、具备产学研用根本的申请项目,研究方向如下:
1.下一代人工智能方法。
发展结合逻辑推理、知识和规则的人工智能方法,建立具有可阐明和可通用性的人工智能理论框架;发展适用于连续、密集数据(如图像)和非构造化数据(如分子构造)的新型神经网络架构,有效捕捉空间、构造、语义等多维度的高下文信息,提高对数据的建模能力。在真实数据集上进行验证。
2.新一代脑启示的人工智能模型与有效演习算法。
针对大脑神经元的物理形态和生物物理的多样性,建立生物神经元与人工神经元之间的简洁且有效的映射关系,使人工神经元具有生物神经元的树突非线性整合与打算功能,为建立其它类型生物神经元与人工神经元的映射供应统一的理论和算法框架。结合大脑神经元网络连接构造、脑区异质性和宏不雅观梯度等特点,设计带生物神经元特性约束的人工神经网络模型,实现影象、决策等高等认知功能。实现不少于3种生物神经元与人工神经元之间的有效映射和3种主要的树突打算功能,与现有映射比较,实现精度、性能和参数可阐明性上的提升。
3.多智能体协作学习理论与方法。
针对多智能体协作时分布式数据处理所面对的寻衅,如泛化性能缺少保障、适应性和可扩展性弱等难题,研究高效的多智能体协作学习理论与方法,详细包括:(1)研究提升多智能体协作学习系统泛化性能的算法,剖析泛化偏差界;(2)针对动态变革的环境和不断扩展的网络规模,研究多智能体系统的适应性和可扩展性,确保智能体能够有效学习并高效协作;(3)在多智能体系统中处理和领悟多模态数据(如文本、图像和传感器数据)的方法,以增强学习效果和提升决策质量;(4)研究在实时或近实时环境中的协作学习和决策策略,关注动态和不愿定环境下的应急相应和关键决策;(5)探究智能体的个性化学习策略,在保持个体上风的同时有效进行集体学习和知识共享。
4.多模态领悟及天生根本模型。
研究多模态数据领悟及天生的根本模型,办理数据视角、维度、密度、采集和标注难易程度不同而造成的领悟难题;研究模态领悟过程中的模态对齐问题,担保模态预测的同等性并减少领悟过程中信息丢失;研究轻量级的领悟模型,提升在模态间非完美对齐状态下领悟模型的鲁棒性;研究用易采集、易标注模态数据来勾引难采集、难标注模态数据的预演习与微调方法;研究大规模多任务、多模态学习的预演习问题,实现少样本/零样本迁移,发展跨模态多样性数据天生的方法;研究多模态大模型的新型、统一概率建模方法,办理离散、连续稠浊数据类型的概率建模与天生难题,提高多模态根本模型的天生效率。在多模态模型中实现不少于3个模态的表示学习、对齐及天生能力,模型参数不少于7B,探索在智能座舱、自动驾驶或多模态对话等领域的运用验证。积累用于演习多模态大模型的优质标注数据,并探索数据闭环,采集数量超过标注样本不少于2个量级的非完美标注或无标注数据,实现模型迭代优化。
5.模型与数据领悟的大模型演习方法。
探索系统性的、自适应数据选取方法,以达到数据和模型的有机领悟,包括:在模型演习过程中on-the-fly 选取下一步所采取的数据的方法;建立数据和模型有机领悟的机器学习框架;发展替代大模型演习普遍采取的先处理数据、再做模型演习的两步走模式的有效方法。
6.***原生的自监督学习方法。
针对***数据既是韶光序列又是图像,但又不同于一样平常的韶光序列和图像的特点,充分利用***数据的属性和特点,发展一套新的自监督学习框架,类比针对韶光序列的predict next token 的框架和针对图像数据的填空框架,并在实际***数据集上加以验证。
7.支持下一代人工智能的通用型高质量科学数据库。
大规模高质量科学数据是人工智能驱动的科学研究新范式的必要条件。研究科学数据、科技文献等的知识工具标注、抽取、领悟中的主动学习机制与自动关联算法;研究面向知识工具的智能编码与机器可识读的多元解析,支持跨领域知识工具的广谱关联,实现与不少于3个国际主流科技资源标识动态互通,支持与外部数据资源智能化领悟;研究多模态跨学科知识碎片对齐与知识工具识别方法,以及多学科领域数据自动生产与增强算法,形成符合国际规范或经同行评议的且覆盖不少于8个学科领域的高质量科学数据1PB以上。
8.AI for Science 的根本举动步伐培植与示范运用。
发展AI for Science的根本举动步伐方法,包括:根本物理模型的人工智能算法;高效率、高精度的实验表征算法;自动化和智能化实验平台培植;科学文献和科学数据的整合与智能运用。发展AI for Science的创新运用,包括但不限于:繁芜催化体系(催化剂动态构造变革、反应网络高度繁芜等问题);碳达峰和碳中和中的核心催化反应;工况条件下的电化学表征方法;生物医学中的高效率和高精度的成像技能;有机合成的自动化和智能化办理方案;定向进化蛋白质工程等。重点支持理论和实验相结合并形成闭环的项目。
四、项目挑选的基本原则
(一)紧密环绕核心科学问题,鼓励根本性和交叉性的前沿探索,优先支持原创性研究。
(二)优先支持面向发展下一代人工智能新方法或能推动人工智能新方法在科学领域运用的研究项目。
(三)重点支持项目应具有良好的研究根本和前期积累,对总体科学目标有直接贡献与支撑。
五、2024年度帮助操持
拟帮助造就项目约25项,直接用度帮助强度不超过80万元/项,帮助期限为3年,造就项目申请书中研究期限应填写“2025年1月1日-2027年12月31日”;拟帮助重点支持项目约6项,直接用度帮助强度约为300万元/项,帮助期限为4年,重点支持项目申请书中研究期限应填写“2025年1月1日-2028年12月31日”。
六、申请哀求及把稳事变
(一)申请条件。
本重大研究操持项目申请人应该具备以下条件:
1. 具有承担根本研究课题的经历;
2. 具有高等专业技能职务(职称)。
在站博士后研究职员、正在攻读研究生学位以及无事情单位或者所在单位不是依托单位的职员不得作为申请人进行申请。
(二)限项申请规定。
实行《2024年度国家自然科学基金项目指南》“申请规定”中限项申请规定的干系哀求。
(三)申请把稳事变。
申请人和依托单位应该负责阅读并实行本项目指南、《2024年度国家自然科学基金项目指南》和《关于2024年度国家自然科学基金项目申请与结题等有关事变的通知布告》中干系哀求。
1. 本重大研究操持项目实施无纸化申请。申请书提交日期为2024年4月15日-4月22日16时。
(1)申请人应该按照科学基金网络信息系统中重大研究操持项目的填报解释与撰写提要领求在线填写和提交电子申请书及附件材料。
(2)本重大研究操持旨在紧密环绕核心科学问题,对多学科干系研究进行计策性的方向勾引和上风整合,成为一个项目集群。申请人应根据本重大研究操持拟办理的核心科学问题和项目指南公布的拟帮助研究方向,自行拟定项目名称、科学目标、研究内容、技能路线和相应的研究经费等。
(3)申请书中的帮助种别选择“重大研究操持”,亚类解释选择“造就项目”或“重点支持项目”,附表明释选择“可阐明、可通用的下一代人工智能方法”,受理代码选择T01,根据申请的详细研究内容选择不超过5个申请代码。造就项目和重点支持项目的互助研究单位不得超过2个。
(4)申请人在申请书起始部分应明确解释申请符合本项目指南中的帮助研究方向,以及对办理本重大研究操持核心科学问题、实现本重大研究操持科学目标的贡献。
如果申请人已经承担与本重大研究操持干系的其他科技操持项目,应该在申请书正文的“研究根本与事情条件”部分论述申请项目与其他干系项目的差异与联系。
2. 依托单位应该按照哀求完成依托单位承诺、组织申请以及审核申请材料等事情。在2024年4月22日16时前通过信息系统逐项确认提交本单位电子申请书及附件材料,并于4月23日16时前在线提交本单位项目申请清单。
3. 其他把稳事变。
(1)为实现重大研究操持总体科学目标和多学科集成,得到帮助的项目卖力人应该承诺遵守干系数据和资料管理与共享的规定,项目实行过程中应关注与本重大研究操持其他项目之间的相互支撑关系。
(2)为加强项目的学术互换,促进项目群的形成和多学科交叉与集成,本重大研究操持将每年举办1次帮助项目的年度学术互换会,并将不定期地组织干系领域的学术研讨会。获帮助项目卖力人有责任参加本重大研究操持辅导专家组和管理事情组所组织的上述学术互换活动。
(四)咨询办法。
交叉科学部交叉科学一处
联系电话:010-62328382
来源:锐动源、国家自然科学基金委员会
本文系作者个人观点,不代表本站立场,转载请注明出处!