关键词:美国,人工智能,武器系统,机器学习,自主系统

周全解读美国人工智能在武器系统中的应用_人工智能_体系 计算机

人工智能(AI)运用于武器系统代表了过去十年研究的一个紧张趋势。
这些举措旨在提高武器精度,实行非主动瞄准手段、赞助导航、制导和掌握(例如,在环球定位系统无法利用的情形下),并与传统的基于物理的方法比较,减少总体打算资源,使更小、更经济的武器系统实现智能瞄准。
这项研究还包括将操作职员的作战空间扩展到无人机,并利用集群方法与有人/无人平台协同作战。

美国国防系统信息剖析中央(DSIAC)2022年10月12日发布题为《人工智能在武器系统中的运用》报告概述了人工智能的历史和含义、人工智能的事理和技能,以及在武器系统中的运用,包括回顾监督自主系统的研究和方案;制导、导航和掌握;行动和路径方案;传感器与信息领悟;智能计策和方案;兵棋建模;以及认知电子战。

背景

1.研究意义

机器学习(ML)和人工智能研究的最新进展揭示了人工智能在实现创新、增加机器的效用以及增强人类能力和履历方面的能力和潜力。
展示关键和干系的人工智能研究和最前辈的技能至关主要,这些技能不仅授予了武器系统比常规武器系统更多的自主权,而且显著提高了它们的杀伤力和作战生存能力。

2.常规武器系统

常规武器技能大多是自动化系统,在操持、实行和完成任务时依赖于一组预编程规则。
利用支持AI的智能硬件增强人在回路系统可以在沙场上供应更多的情报信息,并通过AI系统实行一些大略和常规的任务来缓解人类决策。

无人作战空中系统(UCAS) 是经由验证的具有本钱效益的系统办理方案,适用于情报、监视和侦察 (ISR) 任务和远程空袭。
然而,自动化功能仍旧受到人在回路操作、评估和参与的限定。
虽然在任何可预见的未来都无意肃清武器化人工智能系统中的人为成分,人类的能力将连续构成这些系统协同潜力的上限。
只管如此,人工智能智能武器系统的新生态系统仍将迎来新的战役形式和计策。

3.人工智能简史

图 1-1 的韶光线展示了人工智能的历史和演化。

图1-1 人工智能历史韶光表

4.什么是人工智能

《人工智能:一种当代方法》(Artificial Intelligence: A Modern Approach)一书中给出了人工智能的最新定义,即“设计和构建智能体,这些智能体从环境中吸收感知并采纳影响环境的行动”。
如果以人类为中央来定义人工智能,即以人类的智能水平实行任务,那么人工智能须要感知、推理、推断、知识构建、决策和方案、学习、沟通以及高效改变和操纵环境的能力。
人工智能大致分为三个紧张层次——弱人工智能(ANI)、强人工智能(AGI)和超人工智能(ASI)。
图 1-2 解释了三个层次内的各种分组。

图 1-2:人工智能层次关系

5.机器学习(ML)

机器学习是机器从数据中学习以做出准确预测的能力。
它大致分为四类学习,供应丰富的专用和通用技能系列。

监督学习

在这种学习形式中,演习数据利用包含输入和标记或预定义的输出数据。
如果有丢失的输入或输出条款,则会对其进行预处理,以便将输入精确定位到其真正对应的输出。
通过数据集演习学习,纵然输入数据不在原始数据集,系统也将学会把陌生的输入与其预测输出(标签或值)干系联。
这种类型的演习办理的范例问题是回归和分类。

无监督学习

这种学习形式的系统直接从未标记的数据中创造有代价或隐蔽的构造。
无监督学习用于聚类剖析、降维或估计可能天生输入数据的密度。

半监督学习

当数据集包含标记数据和未标记数据时,这种学习形式的系统利用未标记数据更好地捕获根本数据分布,并得到更好的预测,条件是仅从标记数据进行演习。
这种学习形式适用于演习数据集中标记数据远少于未标记数据的情形。

强化学习

在这种学习模式中,系统利用褒奖/惩罚机制进行演习,使其在系统须要时得到褒奖或在不须要时得到惩罚。
强化学习问题涉及学习做什么(如何将情形映射到行动)以最大化数字褒奖旗子暗记。

最前辈的方法

1.学习AI范式

1.1深度学习(DL)

深度学习是指ML中强大算法的子集,采取深度连接的人工神经网络(ANN),称为深度神经网络(DNNs)。
DNN的构建模块是感知器,它由一个被称为“人工”神经元的信息处理单元组成。
“人工”神经元的当代观点具有以下三个基本要素:

突触:突触是由代价强度加权或表征的连接链。
通报函数:该函数传统上表示线性回归模型(线性组合器),将输入旗子暗记相加,这些输入旗子暗记由它们各自的权重或强度值加权。
激活函数:限定神经元输出幅度的函数。
通报函数可以包括外部施加的偏置值,该偏置值调制(增加/减少)激活函数的净输入。

多层感知器(MLP)是单层感知器和基本前馈网络构造(图2-1)的泛化,其成功归功于偏差反向传播算法,该算法基于偏差校正学习规则。
该算法利用基于梯度低落的方法和链式规则,该算法旨在通过逆着突触连接的方向,通过网络反向传播其关于自由参数(权重和偏差)的变革,来最小化丢失函数(例如,平方偏差、交叉熵等)。

图 2-1:前馈神经网络(单隐蔽层)中神经元的非线性模型

深度神经网络的深度是指网络中的层,无论它是前馈、反馈还是卷积架构。
对付一个神经网络必须是一个DNN的隐蔽层数没有一样平常的规则。
然而,具有非线性激活函数的三层或更多层(包括输出)的神经网络被认为是深度神经网络(DNN)(图2-2)。

图 2-2:深度前馈网络

从大数据天生繁芜模型的深度学习能力提高了准确性和表达能力。
因此,深度学习为人工智能问题领域内的广泛运用供应了以下一系列干系办理方案:

语音、图像和***识别多维数据中的背景评估(例如,成像、***、雷达和监控系统)韶光序列预测函数逼近数据压缩数据非常值检测系统识别场景理解可阐明的人工智能自动驾驶

1.2强化学习(RL)

马尔可夫决策过程(MDP):MDP是一个离散韶光随机过程,用于在随机环境中对基于行动的主体的顺序决策进行建模,在随机环境中,该主体可以行动,并且行动的结果是不愿定的。

部分可不雅观测MDP(POMDP):部分可不雅观测MDP (POMDP) 对不愿定性扩展到状态的情形进行建模。
不对状态的进行精确不雅观察,而只不雅观察与状态的概率关系。
POMDP 的一个常见地决方案是在当前韶光步上推断根本状态的信念分布,然后运用将信念映射到行动的策略。

单智能体强化学习 (SARL):在SARL中,RL模型分为状态、动作和褒奖。
状态是代表当前世界或环境的任务。
动作是RL智能体可以用来改变这些状态的事情,而褒奖是智能体为实行所需动作而得到的效用。

多智能体强化学习 (MARL):MARL是不同于 SARL的另一种强化学习形式。
学习组织环境的机器手、学习走路的人形机器人或学习自行停车的汽车都是SARL的例子。
MARL关注多个智能体如何相互交互以及它们的环境。
MARL有两个理论框架——随机博弈和扩展形式的博弈。

深度强化学习(DRL):DRL是强化学习研究的最新进展的结果,证明了将深度神经网络融入到强化学习算法中的好处。
深度神经网络充当状态到值,或“状态动为难刁难”对到动作值标准的函数逼近器。
当与强化学习一起利用时,深度神经网络阐明输入并供应策略预测。

DARPA 的“阿尔法狗斗”(AlphaDogfight 近距空中格斗) 比赛(图 2-3)以苍鹭系统公司的Heron Systems AI对人类翱翔员的压倒性胜利而告终,首创了一个可信、自主和潜在致命的机器时期。

图 2-3:DARPA 的空战演进项目(ACE) 在仿照中利用“阿尔法狗斗”

2.随机优化和搜索算法

2.1随机优化

随机过程是指捕获随机概率分布模型的随机过程。
在数学优化问题中,随机优化是当随机性存在时,最小化或最大化目标函数的一系列方法:

群体智能(SI):SI 是由分布式、自组织智能体的去中央化集体行动形成的行为模式。
每个个体代理根据其本地规则采纳行动和作出反应,繁芜的群体行为由此展开。
进化算法(EAs):进化算法是一种受自然启示的随机搜索算法,采取进化的事理——繁殖、遗传交叉和变异,以提高系统中期望数量(适应度)的结果。
近年来,进化算法被用于提高人工智能/机器学习模型在所有机器学习过程中的性能——即在预处理(例如,特色选择和不平衡数据重采样)、学习中(例如,参数设置、从属函数和神经网络拓扑)和后处理(例如,规则优化、决策树/支持向量修剪和集成学习)。
物理学启示的算法:从电磁和引力征象到物质和量子物理学,以下算法受到物理天下中不雅观察到的征象的启示:人工势场法 (APF)、仿照退火算法 (SA) 、量子菌群优化算法(QBSO)。
其它元启示式:元启示式算法家族中的其它优化方法是那些提倡集成自适应或学习搜索启示式以智能地避开局部最小值或达到全局最优值的方法。
它们包括以下内容:勾引本地搜索算法 (GLS) 、禁忌搜索算法(TS) 、反应式搜索。

2.2图搜索算法

图搜索算法是一系列针对路径方案运用的搜索算法,例如在静态和动态环境中求解最短路径。
图搜索算法包括D 算法和快速遍历随机树 (RRT)。

3.新兴人工智能范式

在很大程度上,当前范式的运用范围很窄,缺少强人工智能的几个关键特色——可概括性、可阐明性、知识抽象、知识和因果推理。
目前对神经符号人工智能和神经进化(NE)的研究试图以不同的办法办理弱人工智能的一些局限性。

3.1神经符号人工智能

神经符号人工智能是人工智能的一个新兴领域,它将经典的基于规则的人工智能与当代深度学习技能相结合。
该架构强调神经、符号和概率方法与推理之间的交互。
符号部分用抽象知识表示理性。
概率推理在事实、关于不愿定性的推理和看不见的场景之间建立因果关系。
神经部分创造表征和模式,以将环境数据感知为知识,并帮助导航搜索空间。

3.2神经进化(NE)

NE是利用遗传算法对神经网络的人工进化。
遗传算法(GA)不仅可以进化连接权重,作为网络反向传播中,随机梯度低落的替代方案,还可以进化网络构造和连接权重,以显著增强网元网络的性能。
该算法利用该构造来最小化搜索空间的维数。

人工智能在武器系统中的运用

报告重点先容适用于自主系统和武器系统中最前辈的人工智能方法,包括自主、感知中的人工智能、制导、导航和掌握方面的人工智能、任务和路径方案、智能计策、对手建模、认知电子战。

1.自主

1.1定义、自主级别和发展框架

定义:自主系统的特点是能够根据对环境的感知、态势感知以及对本地或动态环境的理解来选择和方案适当的行动路线以达到目标。

自主级别:美国国防部根据自主程度将武器化自主系统分类如下 (见图 3-1):

图 3-1

2.感知中的人工智能

本节重点先容范例自主顶层功能架构中感知干系的最前辈技能。
这些人工智能技能适用于自主核心软件和有效载荷ISR系统(情报、监视和侦察)中的感知。

2.1图像分割

语义理解是将语义与图像内容干系联以构建理解和语境的任务。
图像分割对付场景或视觉理解尤为主要。
分割紧张分为三类——语义分割、实例分割和全景分割(见图 3-2)。

图 3-2:语义分割(b)与实例分割 (c)与全景分割 (d)

2.2目标探测、分类和场景理解

报告强调了在基于图像的紧张数据库寻衅中,利用最前辈的深度神经网络拓扑来处理图像和***数据在感知方面的显著进步。

图像技能:图像分类、图像天生、人体姿态估计、语义分割、视觉推理、视觉问答(VQA)。

***技能:活动识别、目标探测、视觉知识推理(VCR)。

2.3传感器领悟

传感器领悟涉及对各种传感器信息进行摄取和统一。
在自主系统环境中,多传感器领悟用于解码来自多个异构传感器的信息,以推断情境,并得到感测环境的领悟单一“视图”。
人工智能技能已被用来改进感知和定位中的这一主要处理功能。

3.制导、导航和掌握中的人工智能

在多智能体系统中,掌握是根据如何掌握智能体来指定的,在这种情形下,它可以是集中的、分散的或分层的。
在其低级表示中,掌握处理低级任务,例如在制导、导航和掌握 (GN&C) 问题域中创造的跟踪和调节功能。

3.1制导、导航和掌握(GN&C)系统

GN&C是办理掌握和支持运动物体任务的系统部分设计的主要问题领域。
从将卫星送入轨道和制导弹药到导航潜艇,这些系统对付自主系统的运动掌握以及随后实现任务目标是绝对必要的。
GN&C系统描述如下:

丈量车辆瞬时状态的导航系统。
打算最佳轨迹和相应的车辆转向指令以实现最佳轨迹的制导系统。
掌握系统吸收来低廉甜头导系统的转向命令,并在存在所有滋扰的情形下勾引车辆遵照所需的高度。
掌握系统具有三大功能:1)在全体任务中稳定车辆;2)驾驶车辆按照勾引系统指示的所需高度行驶;3)将车辆负载保持在所需的范围内。

DARPA 的空战演进项目(ACE)(图 3-3)便是在繁芜环境中利用人工智能进行武器系统掌握的一个例子。

图3-3:空战演进

4.任务与路径方案

任务和路径方案是机器人和自主堆栈中的主要掌握功能。
它涉及打算从源点到目标点的最优路径或准最优路径。
对付动态环境,这是一个非多项式韶光繁芜度(NP-hard)问题,其繁芜性随着状态自由度的提高呈指数级增长。
路径方案优化常日分为路径搜索方法和轨迹优化问题。
路径搜索方法是通过启示式和元启示式算法办理的。

一个有效的路径方案算法须要知足以下四个性能标准:1)必须以稳健的办法在现实的静态环境中供应最佳路径;2)必须可扩展到动态环境;3)必须与所选的自参考方法保持兼容:4)必须只管即便减少繁芜性和打算资源。

5.智能计策

智能系统的标志性能力是决策推理。
游戏场景中智能计策和方案的主要运用包括:单智能体系统(深度思维的AlphaGo、AlphaGo Zero、Alpha Zero、 MuZero)和多智能体系统(OpenAI Five、深度思维的AlphaStar)。

6.对手建模和兵棋推演

对手建模分为三种方法——策略分类、基于目标的天生模型和策略近似:

策略分类旨在通过监督或博弈论方法从学习专家那里预测策略。
在基于目标的天生模型中,一个或多个智能体如何实现一个目标是行为分类的根本。
策略近似从状态/动作集学习函数映射,预估对手行为背后的真实策略。

7.认知电子战

电磁频谱是战役的主要前沿;当代和常规武器依赖电磁、光电和声学旗子暗记进行通信、情报、传感和武器投送。
当代人工智能方法有望将统计旗子暗记处理和信息论中的传统电子战(EW)问题重新定义为人工智能问题。
人工智能在电子战中的利用,现在称为认知电子战 (CEW),已经得到了极大的关注,特殊是在自动调制分类、自动脉内调制分类和雷达脉冲重复间隔跟踪领域。

范例的当代电子战系统分为三个运用领域或系统构成(见图 3-4):

图3-4

由电子增援方法 (ESM) 系统供应的电磁威胁拦截、识别和定位。
由电子对抗(ECM)系统供应的进攻性方法,滋扰或阻挡仇敌的电磁作战手段。
由电子反对抗(ECCM)系统供应的防御方法,供应弹性和保护免受仇敌的电子对抗。

将人工智能运用于武器系统的系统和项目操持

美国政府已经建立了一些专门针对人工智能的主要机构。
联合人工智能中央 (JAIC) 由美国国防部于2018 年景立,旨在通过利用人工智能技能来扩展和转变美国的军事能力和做事,加速人工智能的利用,并领导国家努力保持美国的军事技能上风,成为与人工智能干系的下一代技能的环球力量。

卖力研究和工程的国防部副部长(USD[R&E])成立自主系统的利益共同体(CoI),个中之一侧重于自主方面的研究,旨在鼓励跨领域技能重点领域的多机构折衷和协作,为折衷全体部门的科学和技能计策、分享新想法、技能方向和技能机会供应了一个论坛。

在美国联邦层面和国防部之外是主要的人工智能干系组织,例如国家人工智能咨询委员会 (NAIAC)、国家人工智能安全委员会 (NSCAI) 和国家人工智能研究所。

1.空中系统

1.1下一代空中上风操持(NGAD)

美国空军目前正在根据NGAD操持开拓第六代战斗机。
这些战斗机的一个关键要素是“人工智能僚机”、人工智能自主功能和有人-无人编队(MUM-T)能力的集成。

1.2 X-61“小精灵”

X-61“小精灵”是源自 DARPA 的 Gremlins 操持的技能演示平台,旨在供应半自主、空中可回收且低本钱的 UCAS(图4-1)。
X-61 可以携带多种有效载荷,包括 EO/IR 成像、电子战传感器和武器。

图 4-1:“小精灵”无人机

2.海上系统

美国海军正在将人工智能技能运用于几个正在进行的自主平台开拓操持。
与国防部指令准则同等,人工智能技能通过海军的无人海上自主架构和通用掌握系统采取。

“海上猎人”是一个无人海军平台,用于开拓 TTP(战术、技能和程序)。
它是海军自主开拓的测试平台之一。
它的自主性如此发达,以至于它从圣地亚哥航行到珍珠港。
2020 年 8 月,第二艘名为“海鹰”的海上猎人下水(图 4-2)

图 4-2:美国海军的“海上猎人”首次展示

3.陆地系统

3.1德事隆系统“粗锯齿 ”M5

“粗锯齿”M5(Ripsaw M5)是第五代中型无人战车,具有完备自主能力的美国陆军技能演示器,是其三层美国陆军机器人战车项目 RCV 决定性杀伤力连续体观点的一部分(图 4-3)。

图 4-3:陆军“粗锯齿 ”M5无人战车

4.蜂群系统

4.1DARPA's 进攻性蜂群使能战术(OFFSET)

DARPA 的OFFSET是下一代作战技能生态系统的操持推动者,旨在生产各种具有集群任务能力的无人平台。
该操持设想利用超过250个无人机和地面系统的蜂群协作。

4.2CSDB小直径炸弹群

CSDB是一种基于在“金帐汗国”操持下开拓的自主武器弹药的集群技能,该操持属于美国空军的“先锋”(Vanguard) 操持之一,CSDB的集群技能旨在供应自主识别、目标选择和打击能力。

5.战斗管理与智能指挥掌握

为了知足下一代沙场的数据密集型和网络处理哀求,国防部正在加紧开拓多个别系,支持具有人工智能任务方案和作战管理能力的联合全域指挥与掌握。

美国陆军的培植性机器学习对抗战术 (COMBAT) 操持旨在利用人工智能开拓前辈的对抗性兵棋战术,以确保美国军队的长期战术上风和为仇敌强化无法预见的沙场现实。
DARPA 的可阐明人工智能操持将通过确保人工智能能够产生可阐明的模型和推理并以人类可以理解的办法呈现基本事理来帮助战斗管理决策者。
这个过程将利用神经符号人工智能和最前辈的人机交互技能。

6.ISR和目标系统

6.1复仇女神系统(NEMESIS)

虽然增强现实供应了信息上风并增强了作战职员在战斗中的感知,但NEMESIS增加了自动化、关键决策制订的战术维度。
NEMESIS是一个仿生视觉AI系统(图 4-4),旨在通过领悟多模态传感器、识别场景和情形、阐明情境以及向战斗职员实时供应快速、智能的决策和策略来仿照人类的视觉和认知。

图 4-4:NEMESIS

7.导航

常规武器系统依赖 GPS 旗子暗记锁定惯性导航系统办理方案来得到准确的实时位置、导航和授时 (PNT) 信息。
然而,在通信旗子暗记可能受到滋扰和欺骗的严厉和电子敌对环境中,任务实行可能会由于导航系统中丢失位置和韶光精度而中断。
人工智能驱动的技能正在开拓和测试,以在这种环境中保持导航。

DARPA 的“垂钓者” 操持(Angler) 旨在开拓一个水下平台,该平台能够在没有卫星和地面通信的情形下实行完备自主的长期任务,并借助传感器套件在阴郁、湍流和半透明的环境中供应感知。

未来沙场中的人工智能

马赛克战作战观点采取多域、非均匀和不对称的力量投射,采取不同类型、种别、配置和大小的各种武器平台。
通过马赛克瓷砖的类比,该观点预见到所有组成部分汇聚在一起,形成一种非常规的打击力量,从而扰乱和毁坏仇敌的稳定(图 5-1)。
该观点的特点是其动态互操作性、可扩展性和集成灵巧性,从而实现了新武器技能和具有本钱效益的系统的敏捷集成。
人工智能的利用是马赛克战役的关键推动力。

图 5-1: 陆军的“机器人和自主系统计策”

利用人工智能,下一代武器系统将具有高度集成的自主功能和决策能力。
关键发展领域将以人工智能为目标,实现更高水平的跨域信息领悟、智能自适应拓扑网络、快速数据处理、部分信息弹性掌握、分布式掌握和准确预测能力。
无人装备将采取前辈的视觉、雷达和声纳算法,用于ATR、多模态传感器领悟以增强感知和智能任务方案。

此外,由及时、关键、准确和精髓精辟的战斗代价信息传播支持的跨域互助构成了计策作战和战术上风。
未来人工智能通过可操作情报准备供应将海量态势和沙场情报数据(旗子暗记情报 [SIGINT]、电子情报 [EINT] 以及丈量和特色情报 [MASINT])转换为粗略的智能方案的能力,这不仅有助于减少认知负荷,还有助于指挥官和操作员的计策决策。

结语

人工智能有望成为确保未来沙场战备和战术上风的决定性成分。
群体智能、人机交互、非线性自适应掌握、视觉感知、对手建模和认知电子战是利用人工智能供应前沿智能战斗系统的一些关键领域。
此外,随着神经符号人工智能和神经进化人工智能研究的最新进展,正在超过边界以缩小弱人工智能(一样平常人工智能)和强人工智能(完备人工智能)之间的差距。