人工智能具有巨大的潜力。美国家人工智能安全委员会提出:“与人类相比,机器有着更加快速高效的观察、决定和行动能力,这在任何一个领域都能提供改变世界的竞争优势”。关于将人工智能技术应用到兵棋推演领域的优点,美智库相关研究认为,“人工智能系统不仅实现了兵棋推演中许多流程的自动化,提高了效率,它们还使人和机器能够以新颖的方式协同工作”。人工智能的崛起为兵棋推演带来了前所未有的机遇,也将使兵棋推演发生颠覆性的变化。

人工智能在兵棋推演中的应用案例

目前,人工智能技术已经在部分方向上实现了成熟的应用,但将人工智能应用于兵棋推演这一垂直领域仍是一片蓝海,相关研究大部分处在理论层面,同时也有小部分的实践探索。

兰德公司利用人工智能、仿真模拟技术支撑战略战役级兵棋推演。本次推演旨在探究以美国为主的北约如何在欧洲方向上应对来自俄罗斯等主要战略对手的威胁,聚焦作为北约成员国的波罗的海诸国,假设该地区在近未来(10年或更长时间后)出现威胁升级或冲突,并在这样的背景下,通过人工智能、模拟仿真等技术进行定量分析,测试北约相关作战概念。其推演结论是:基于概率推理方法的人工智能技术,可在决策制定过程中向对阵员提供预估行动方案的成功率,有利于对阵员做出正确的决策。

美国联合军事职业教育计划使用人工智能增强战略级兵棋推演实验。本次推演旨在验证将人工智能模型应用于战略级兵棋推演的可行性,探究应用人工智能进行推演与传统人工推演相比具有何种优势,探索将人工智能应用于战略兵棋推演对职业军事教育具有怎样的影响。本次推演基于一个城镇供电系统遭受网络攻击而中断的突发性事件,通过限制决策时间的方式,模拟现实中处置突发情况短暂的时间窗口。其推演结论是:第一,人工智能模型能够与人类密切协作,在兵棋推演中辅助人类决策;第二,人工智能模型具备快速进行决策推荐、全面分析场景要素、良好适应动态问题的优势;第三,人工智能模型可以让决策者更好地适应复杂的网络环境,从而在面对危机之前做好准备。

人工智能在兵棋推演中的应用初探

兰德公司战术兵棋推演配备

人工智能情况下的双方部队初始配置

兰德公司基于人工智能平台开展战术兵棋推演实验。2020年9月,兰德公司的研究人员推演了一场蓝军(美国)和红军(俄罗斯)连级作战单元,利用由遥控/无自主能力战斗车辆,以及具有人工智能与机器学习能力的AI使能战斗车辆参与的战术行动。推演尝试了在桌面战术兵棋推演中运用具体的、有代表性的人工智能和机器学习技术,并通过一系列的推演、分析和测试来全面研究人工智能和机器学习技术,初步洞察人工智能和机器学习技术运用于作战车辆的潜能和局限性。推演设置了基准场景及人工智能和机器学习场景,两个场景的区别在于车辆的指挥与控制方式。其推演结论是:第一,与自主机器人战车和有人车辆相比,遥控机器人战车存在容易被利用的明显劣势;第二,人工智能和机器学习能力可以集成到战术级地面作战兵棋推演;第三,这种操作员和工程师联合参与的兵棋推演,有利于需求方和采购方充分明确开发人工智能和机器学习系统的需求和工程指标。

人工智能应用于兵棋推演的优势特点

为何要在兵棋推演中应用人工智能技术?将人工智能应用于兵棋推演会呈现出什么样的优势?为回答这些问题,国外各科研部门、高校、智库进行了广泛、深入的研究与实践。

人工智能可以辅助创设更加拟真的推演情景。在设计兵棋推演情景时,设计人员通常需要添加增强情景拟真度的元素,但通过人工或预设算法进行添加耗时费力,且在复现复杂情景时效果欠佳。将人工智能技术应用于兵棋推演情景设计,能够实现更为优良的拟真度。一是利用人工智能针对指定的情景快速生成内容。目前ChatGPT(一种自然语言处理人工智能模型)、Stable Diffusion(一种人工智能绘画模型)等一系列人工智能模型的出现,证明了人工智能生成内容的技术已较为成熟,人工智能生成内容的风格高度类似人类创作,因此可以依托人工智能深化、补充兵棋推演相关情景,进一步强化参与者的沉浸感,使参与者能够做出更贴合现实的决策。二是依托人工智能实现情景的自动化运行。推演情景中,部分无须人工控制的实体可交由人工智能自主运行,保证推演高效、连贯的同时,还能实现更为丰富的变化,进一步还原真实作战环境的复杂程度。

人工智能在兵棋推演中的应用初探

人工智能可以辅助创设更加拟真的推演情景

人工智能可以赋能人类对阵员的计算和决策。人工智能技术为处理模糊和不确定性问题提供了全新可能性,这使得计算机强大的算力可以更有机地融入兵棋推演中,大幅提升推演效率,节约对阵员的时间和精力,从而让对阵员能够推演更多的内容,或将注意力集中在关键问题上。一方面,人工智能依托计算机技术,在兵棋推演中可以进行毫秒级的分析,辅助对阵员决策;另一方面,人工智能能够直接识别计算机的语言,能够不依赖专业技术人员,让对阵员做到与计算机直接交互,从而提高推演整体的运行效率。

人工智能能够提供更高质量的决策建议。人工智能的内在逻辑和算法基础有助于生成更高质量的策略,在兵棋推演中,人工智能在某些方面能够媲美一名经验丰富的顾问,为人类对阵员提供高质高效的决策建议。一是大量训练数据为人工智能决策提供了大样本量。相较于一般经验水平的人类对阵员,人工智能在进行决策时具备显著的样本量优势,这一优势为人工智能生成的策略带来了更高的可推广性,往往能更好地反映真实的作战情况。二是算法机理赋予了人工智能先天优势。现阶段运用到兵棋推演的人工智能算法中,普遍运用到了蒙特卡洛树搜索方法(MCTS),算法的循环包含4个步骤,即选择-扩展-模拟-回溯,其中“选择”“扩展”的步骤提供了多方案交叉比较、择优选用的机制,“模拟”的步骤提供了单方案反复模拟、精细打磨的机制,两种机制相辅相成,不但提高了决策的质量,更能够及时发现可能的风险。

人工智能在兵棋推演中的应用初探

蒙特卡洛树搜索方法

人工智能能够考虑到更全面的要素和细节。人工智能可以依托计算机多线程、高速率处理问题的优势,在兵棋推演中比人类考虑到更全面的信息,带来更广阔的视角或产生令人惊奇的结论。一方面,人的注意力是有限的,心理学家丹尼尔·卡尼曼曾提出“资源限制理论”,认为人类的注意力是一种有限的认知资源,同时进行的任务所需要的认知资源之和不能超过人的认知资源总量,而人工智能基于计算机技术,其短时间内处理大量信息的能力远高于人类,在兵棋推演中应用人工智能可以在短时间内获得全局性、系统性的视角,对阵员决策时能够更加充分地考虑风险、后果和成本,从而制定更高质量的决策。另一方面,人工智能因为技术特点往往能够发现人类意想不到的策略,人工智能使用的算法蒙特卡洛树搜索方法在数学原理上鼓励对每一个分支进行充分模拟,以尽可能确保不遗漏任何可行的策略,因此可以“带领”对阵员跳出人的思维定势。

人工智能能够构建更深层次的人机协作模式。兵棋推演离不开人的参与,而人工智能在人类和计算机之间建立了合作的桥梁。关于如何依托人工智能技术构建人机协作模式,从而将人类处理模糊、不确定信息的优势和计算机的强大算力进行有机结合,相关研究基本可归纳为两大方向。一是“人在回路中”方向上。前美国防部副部长鲍勃·沃克提出了一种名为“半人马”的人机协作模型,旨在建立一种人机高度耦合的协作关系,但关键的决策仍然由人类完成,美国关于构建兵棋推演中的人机协作模式研究实践大都深受这一模型的影响。二是“人在回路外”方向上。相关人机协同模式或是侧重于训练人工智能对阵员,用来磨练人类对阵员的决策技能,或是应用人工智能自动制定一些简单、低风险的决策,从而提高整体推演效率,例如2020年5月,DARPA启动了名为“建设性机器学习对抗对手策略(COMBAT)”项目,旨在建立由人工智能对阵员组成的红方小组,在兵棋推演中与蓝方进行对抗。

人工智能应用于兵棋推演的矛盾和局限

尽管将人工智能技术应用于兵棋推演好处多多,然而相关研究实践证明,人工智能并非兵棋推演的“万能灵药”,二者的结合应用仍然存在一定的局限。

人工智能的黑箱效应与推演结果可验证之间存在矛盾。充分理解人工智能做出决策的机理,需要相当高的专业门槛,这带来了严重的黑箱效应。人工智能介入到兵棋推演的过程之中,非专业人员既难以理解人工智能的决策逻辑,又难以核查训练数据的全面性,严重影响了结论的可信度。

人工智能技术的高成本与兵棋推演通用性要求之间存在矛盾。人工智能目前作为一项高新技术,仍具有较高的应用成本。从兵棋系统开发的惯例来看,高成本的系统往往需要具备一定的通用性。然而目前的人工智能技术在通用性上表现欠佳,主要因为人工智能模型的发挥依赖于训练数据,而训练数据又不可能做到包罗万象,这就导致一旦推演规则的变化超出了训练数据集的覆盖范围,人工智能模型就必须重新训练才能够适用。成本高、通用性差的兵棋系统需要占用大量的预算,又难以通过适配多个项目来分摊成本,不利于推广使用。

应用人工智能过度追求高拟真、大系统,与控制推演复杂度之间存在矛盾。人工智能为兵棋设计提供了一种高质高效的途径,不但情景元素可以更丰富,兵棋系统也可以涵盖更多的战争要素。但一方面,人工智能自动生成大量情景元素会令对阵员接收到过多的信息,这不但会导致兵棋的上手难度飙升,而且推演时对阵员的注意力难以集中在关键问题上;另一方面,人工智能的强大能力会“诱导”兵棋设计人员尝试设计更大、更包罗万象的兵棋推演系统,但更复杂的系统不仅具有更高的开发难度,后续运维、迭代的成本也将更为高昂。

人工智能在兵棋推演中的应用初探

应用人工智能可为兵棋推演

对阵员减轻工作负担

应用人工智能为对阵员过度减负,与兵棋推演体现“人的因素”之间存在矛盾。人工智能提供的决策辅助能够节约对阵员的时间和精力,从而推演更多问题或聚焦于关键问题,然而,不恰当的设计会导致人工智能参与决策程度过高。美兵棋推演大师彼得·波拉在其著作《兵棋推演艺术》中提出,“只有当对阵员做出决定并必须处理后果时,兵棋推演的效果才能达到最好”。若缺乏限制机制,对阵员做决策时可能会过于依赖人工智能的辅助,导致对阵员将“做出决定并处理后果”的权柄转移给机器,这样一来,难以达到兵棋推演训练决策者的目的,也将不能很好地模拟现实中的决策压力,影响推演有效性。

文章来自于微信公众号 “中国指挥与控制学会”,作者 “鲁御新、李宗一

关联网址

关联标签

文章目录

发评论,每天都得现金奖励!超多礼品等你来拿

后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则
暂无评论...