汪洋
【学科发展】下一代兵棋(Wargames):挑战、对策和未来
2019-1-11 20:23
阅读:1054

【学科发展】下一代兵棋(Wargames):挑战、对策和未来

1.jpg



兵棋:导演战争的“魔术师”


兵棋是一种策略游戏,其目的是通过推演者的不断推演,形成更为合理的决策。它综合运用统计学、概率论、博弈论等方法,全过程仿真、模拟和推演战争,评估战术、行动和战略的交互式推演,包括兵力投送、战场态势变化等诸多方面。


人类面对复杂的情况的计算能力是有限的。因此,在实际的策略选择和方案制定的决策上,就需要先进行可行性分析和结果推演计算,以起到评估和发现漏洞的作用。在过去的一个世纪中,特别是冷战爆发以来,兵棋已成为军队和决策者评估核武器和国际安全战略决策的一种不可或缺的手段。


兵棋推演的历史可以溯源到4500年前,中国人开始使用石块和木条等在地面上对弈的方法演示阵法、研究战争。现代类型的战棋是由普鲁士的宫廷战争顾问冯·莱斯维茨于1811年发明的,它由一幅地图、一套代表军队的硬方块、一本详细规则、一张概率表和一个骰子组成,可以逼真地预测当时战场的实际作战活动。19世纪和20世纪,兵棋推演已经成为正式的军事教学和军训训练的必备科目。

2.jpg

(图片来自网络)

挑战:理论丰富,数据贫乏 

兵棋推演技术预测和推断现实世界冲突和合作,越来越依赖于基于计算机的数学模型,已发展成为一种基于计算机的探索性模拟游戏和结构化练习,理论上已日趋成熟。但在很多情况下,我们能获取的观测数据是有限的,存在数据获取的伦理难题。例如,由于没有核武器使用的观测数据,核威慑模型只好将预测国际合作或核升级的复杂模式简化为“玩具”模型,未能很好地考虑驱动决策的人为因素,如玩家在危机发生时或决策时间很短时,做出理性决策也许是不可能的。尽管决策者、经济学家和社会科学家在传统的兵棋模拟中考虑了人为因素,不断探索游戏设计,运用结构化的游戏环境来模拟现实世界决策。但这种简化模拟复杂性不足,玩家有限,场景单一,无法收集足够数据。例如,美国专为制定越战战略开发的Sigma II-64兵棋,由兰德公司40多名分析师历经数月开发,仅实现了35名左右的玩家参与。 


现有博弈模拟方法中实验研究不够,过多关注游戏环境过程内部的行为调查(如分析玩家之间的对话),没能将每个游戏本身作为因果推断的分析单元。如果游戏玩家是参与现实决策的高层决策者,他们的专门知识和见解会非常有价值。美国海军战争学院和美国战略司令部曾开展了“威慑与升级游戏与回顾”系列双面游戏,探索危机期间的升级动态,同时提供反事实探索,允许游戏设计者参与跟踪讨论。这种类似于棋盘游戏的结构化练习,有利于设计者更好地控制游戏动态,增加分析游戏贯穿能力。兰德公司的一次桌面演习,目的是分析俄罗斯2014年乌克兰事件后波罗的海地区所面临的挑战。通过这款游戏,来自美国空军和陆军的玩家分析了要想保卫北约成员国和威慑该地区所必需的部队构成,讨论了该地区定性和定量部署部队问题。 


但是,玩家在这种程式化规则的博弈中,会受到实验室效果的影响。玩家也许会考虑在同伴面前采取行动的声誉损失,因而不会采取积极行动。由于参与人数较少、轮流次数也有限,给捕捉到真实世界的动态造成困难,因而,这种结构化演习得出的相关推断受到质疑。此外,每个游戏穿透次数有限,给数据收集带来了挑战,游戏后的外部有效性分析也增加了难度。结果是棋盘兵棋倾向于以从游戏本身得到洞察,而不是基于赛后客观分析得出一般性结论。 因而,大家的注意力主要集中在模拟游戏上,用于训练和教育目的,而不是实验目的。国家核安全管理局曾经为高层决策者开发了一款基于Apex Gold情景的讨论计划,用于测试参与者如何一起工作,应对假设的核恐怖主义威胁,计划设计了一系列问题和民意测验,有助于参与者讨论应对核安全挑战。



对策:分析现有的游戏数据

分析档案资料和现有的游戏数据,也许可以解决数据匮乏问题。例如,Reid Pauly利用MIT和美国国防部的资料,研究分析了Lincoln Bloomfield和Thomas Schelling在20世纪60年代所设计的兵棋的笔记和游戏结果。他通过观察一系列博弈中的类似行为,提出决策者的一种普遍行为模式,确保在危机中和受到挑衅时实现核约束。Jacquelyn Schneider研究了最近7年来美国海军战争学院的网络战兵棋纵向数据,结果发现,网络能力似乎对危机不稳定性没有贡献,这一结论与政策制定者的声明相反。

     

虽然分析和挖掘传统兵棋推演获得的结果集合,能够得出单个游戏无法推断的定量结果。但这种方法也存在挑战,包括时间密集问题,数据收集的自动化问题,以及无法解决超出游戏原始场景的替代研究问题等。此外,研究框架、参与者的身份和机构归属以及地缘政治环境变化等多种因素,也让人产生“比较苹果和橙子”的担忧。 

    

商业游戏的游戏过程中,也可以产生模拟真实世界环境的实验数据。例如,魔兽世界是一款大规模的多人在线角色扮演游戏,400万玩家角色如同受到“病毒”感染般的影响。流行病学家利用这种游戏世界中“病毒”从一个玩家传播到另一个玩家,模拟研究传播率和感染链,并与现实世界的病毒大流行进行比较。 

    

过去十多年来,许多学科都在探索商业游戏在实验研究中的应用。例如,虚拟世界中的“第二人生”(Second Life)等平台,已成为研究人类社会行的实验室,玩家在这些平台上,可以创建全新的身份和社会关系。经济学家利用网络游戏研究虚拟货币、金融系统、密码货币、分散金融和连锁银行等。军事家研究“夏娃在线”平台上的“B-R5RB大屠杀”之类的战斗游戏,这款游戏大约涉及有7500个玩家、2000万虚拟士兵和600艘虚拟军舰,用来研究大规模战争的起源、发展态势和结果等问题。 

    

但是,这些毕竟是游戏环境,超出了研究人员的控制范围,从而限制了可测试理论的产生。社会科学家为了尝试使用商业软件控制实验环境,创建了独立的“mods”——用户生成的环境——在游戏中,比如魔兽世界、星球大战星系和星际争霸2,以从政治、经济和社会学角度考虑人类行为、合作和冲突的理论。NetLab率先在2000年代初创建了各种各样的“合作”,试图利用互联网进行社会和行为实验。例如,“部落”以真实世界的苏丹部落间竞争为模型,衡量(人为创造的)群体间和群体内的动态。尽管这些mods为研究人员提供了对结构化游戏环境的更多控制,但仍受制于与原始游戏发行商相关联的虚拟世界、角色和玩家池。 


未来:建立实验条件

社会科学家正致力于从零开始建立实验环境,开展可复制的定量分析,重点是模拟特定的现实世界决策。这种从头开始构建游戏方式,可以解决研究人员无法控制游戏设置以及随后提供给游戏参与者的作业变数问题。但建立这种实验环境的成本很高。随着低成本游戏架构和可视化脚本系统的激增,研究人员为解决感兴趣的特定问题,设计基于实验的在线游戏逐渐成为可能。


但是,这种游戏的设计和开发也面临着自身固有的挑战。研究人员一开始就需要决定构建哪种类型的游戏,从简单到复杂,从轮流到同时进行,还要考虑玩家数量、作业变数、美学、机制以及交互界面等,这些都会影响游戏开发成本、内部和外部有效性。例如,设计可向所有玩家提供的实时策略游戏中的完美地图,或是将敌方移动隐藏在“战争迷雾”之下等。 虽然更加现实,但设计也更加复杂。

    

虽然在线实验游戏的最佳设计和局限需要进一步研究,但在线实验游戏可复制,具有结构化规则集,是一种基于回合的迭代游戏,可以很好地克服传统兵棋方法上的挑战,增加游戏穿透次数。此外,在线环境也提供了传统兵棋所不具备的研究多样化参与者的工具。例如,Steam游戏平台经常有1000多万独特的并发在线玩家。最近,伯克利加州大学、劳伦斯•利弗莫尔国家实验室和桑迪亚国家实验室合作推出了Nuclear Gaming 项目(PONG)和SIGNAL游戏,这两款游戏第一次在核威慑和冲突升级动力学研究中实现了大规模实验性游戏方法。其中SIGNAL提供了一个灵活的游戏环境,可用来研究和仿真现代战争的各种问题。该平台还实现了多玩家环境下,定量分析大量游戏结果,追踪人口统计数据,并自动实时收集玩家和游戏数据。 


随着这类新实验游戏工具的成熟,其最新进展都可以在数据科学和机器学习中得以大量应用。例如,游戏数据可用作机器学习算法中的输入,从而可扩展其在特定实验条件下创建最佳行为模型的数据量。此外,还可利用这些数据来自主代理并创建训练数据中的各种玩家策略,用于开发人-机和机-机游戏。比较分析玩家模型及其参数,可进一步揭示玩家“类型”,从而进一步增强我们理解冲突策略和危机沟通。还可以利用游戏数据,采用逆强化学习方法,来评估玩家在模拟环境中对奖赏、约束和最优实现策略的感知。 


近年来,美国将多域战视为其未来安全和在冲突中取胜关键。据推测,多域作战将缩短“数据到决策”的周期。重要的是通过适当的安全防护措施在适当的时间将适当的数据送达适当的地点,从而使得各层级的参与方能迅速做出明智的决定。 多域作战需要能在同一平台上结合传感、共享和行动的技术,从而创建分布式的指挥与控制环境。


美国洛克希德·马丁公司自2017年4月开始研制多域兵棋桌面演习技术,通过重点关注对于复杂任务计划制定和动态执行至关重要的要素和流程,运用包括空中、陆地、海上、太空和网络在内的全部域,多域作战支持作战人员根据不断变化的态势采取行动并做出响应,以压倒性的节奏给对手造成困境。该公司持续投资各种转型技术以应对多域战的复杂性,重点关注为大规模系统的系统建立模块化、规模可调节、开放式的体系结构。


实现:仍有难度

尽管构建可定制的在线游戏能针对特定的研究问题,提供一条通向实验性游戏的最优路径,但实现难度仍然很大,可靠地预测对手的行动和冲突结果仍不太可能。首先,游戏设计者必须解决在线游戏可能会导致游戏玩家的行为“实验室效应”问题。例如,在线玩家比在其他场合也许更具攻击性。此外,在线玩家基本上都是非专家,也会对游戏结果产生影响,尤其是在涉及国家安全的决策中。因此,这种利用非专家进行大样本分析的实验游戏结果,还应与由经验丰富的决策者参与的传统兵棋结果进行比较。需要更多的研究才能将在线实验环境的观测结果,外推到现实世界规律中。 


随着实验性游戏方法的成熟,政府机构特别是那些与国家安全有关的机构,已越来越多地在政策规划使用仿真技术,其工具包可针对政策和国防领域大量现存问题进行定制,分析日益复杂安全环境,尤其是研究战争的新型参与者和新领域,包括空间、网络和灰区行动等。建立兵棋数据仓库也十分重要,如美国国防部长办公室创建了新一代兵棋仓库,进行汇集和综合分析,从而进一步改进现有模拟和数字的兵棋方法。 


当代兵棋推演技术利用先进、成熟、成本低廉的拖放式数字游戏开发工具,运用自动化、大数据、人工智能和机器学习、开放式体系结构、模式识别以及物联网以及云计算等最新技术,集成了大量跨方法和跨学科的社会科学仿真工具和实验手段,已初步具备大规模、多人体验的能力,正逐步从游戏启发转变为一种基于科学的实验游戏方法。并且,这种方法的应用已超越军事领域,在选举、政府政策、危机应对、国际贸易和供应链机制等经济、政治、外交等几乎所有的人类对抗活动中得以广泛应用,如评估商业主管如何应对在油价大幅下跌,评估网络武器的使用决策等。信息化时代的未来战争将是一种“多域战”,战域从传统自然空间(陆海空天)到技术空间(电磁网络空间)和认知空间(人脑)不断拓展和复合,研究和部署下一代兵棋将是未来信息化战争的制胜法宝。




参考文献:

http://science.sciencemag.org/content/362/6421/1362


编译 | 贺飞,北京大学学科建设办公室

转载本文请联系原作者获取授权,同时请注明本文来自汪洋科学网博客。

链接地址:http://wap.sciencenet.cn/blog-2903646-1156563.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?