博文

[转载]AI再次完胜人类！DeepMind在星际争霸II中10:1击败职业玩家

已有 1950 次阅读 2019-2-2 09:00 |个人分类:海洋报道|系统分类:海外观察|文章来源:转载

AI再次完胜人类！DeepMind在星际争霸II中10:1击败职业玩家

来源：集智小编集智俱乐部 2019-01-25

直播现场

今天凌晨，在 YouTube 和 Twitch 上播出了一系列星际争霸 II 游戏比赛中，谷歌子公司 DeepMind 开发的人工智能系统 AlphaStar，连续10场比赛击败人类。

星际争霸 II 是著名的即时战略游戏，这是人工智能在该项赛事中首次与人类顶尖职业选手对战，并取得压倒性胜利。

谷歌放出了两个系列共10场对战视频录像，这10场比赛2018年12月进行的。在这两个系列中，AlphaStar 分别与人类职业选手 MaNa和 TLO 的对战，都已5:0的战绩横扫人类玩家。

最受瞩目的，是今天 AlphaStar 和人类选手 MaNa 的一场直播比赛。比赛中 AlphaStar试图将整个军团作为整体推进，横扫 MaNa 的基地。但 MaNa 在 AlphaStar 基地后方反复骚扰，获得足够的建造时间。虽然 MaNa 曾经被 AlphaStar 多次击败，但在 AI 面前，人类也有学习能力。

尽管 MaNa 发现了 AlphaStar 的漏洞，获得了人类玩家的唯一一次胜利。但 AlphaStar 已经与另一位职业选手 TLO 在比赛中，取得了5:0的完胜。只能说这是挽回颜面的一局。

AlphaStar 与人类选手 MaNa 今晨直播对战视频

全部比赛过后，AlphaStar 在星际争霸 II 中与人类对抗的总战绩是10:1。

DeepMind 研究员 David Silver 在赛后表示，人工智能已经在不同游戏中取得许多标志性的胜利，此前包括国际象棋、围棋、Dota2 等。未来仍有大量工作要做，但将来人们回顾今天，也许会认为这是人工智能跨出的重要一步。

在实时影像类电子游戏中击败人类似乎跟人工智能的主要功能无关，但这是一项重大的研究挑战。类似星际争霸 II 这样的游戏，对于电脑来说比棋盘游戏难度更高。

在星际争霸 II 中，人工智能无法观察所有物体的移动从而计算后续行动，而是被要求和人一样，只能通过观察屏幕视域内的物体移动，来做出实时反应。

在与 MaNa 和 TLO 的比赛中，AlphaStar 的平均每分钟动作次数的分布，以及观察与行动间的总延迟时间

TLO 和 MaNa 等职业玩家平均每分钟可以做出数百个游戏动作，但这比现在多数机器人要弱。为了提高系统的反应准确性，AlphaStar 平均每分钟发出的动作只有280次，这比人类职业玩家还要低。原因是 AlphaStar 模仿了人类玩游戏的方式。此外，AlphaStar 的观察和行动之间的平均延迟时间为350毫秒。

但这些没有成为难倒 DeepMind 人工智能系统的障碍。AlphaStar 使用深度神经网络学习星际争霸 II 的完整游戏视频，利用原始游戏数据，以监督学习和强化学习的方式进行训练。

AlphaStar 还使用了多体智能算法（multi-agent learning algorithm）。研究者为智能体（agent）设置了目标（获胜或者仅仅活着），首先通过模仿人类玩家来学习，然后让智能体相互比赛，最强的生存下来，最弱的被淘汰。

AlphaStar 的图形处理可视化

DeepMind 估计，AlphaStar 通过强化学习的方式，已经积累了大约200年的游戏训练时间！

与人类玩家在游戏中对抗的目的并不是在游戏中击败人类，而是为了提升 AI 训练方法，更是为了尝试在类似星际争霸游戏这样的复杂虚拟环境中，建立可运行的 AI 系统，最终实现可以执行任何人类任务的通用人工智能。

因此，重要的不是击败人类，而是通过比赛对 AI 的任务表现进行基准测试。

而 AlphaStar 的这次比赛并非终点。参赛的 MaNa 和 TLO 两位选手虽然是职业选手，但仅仅是优秀职业选手，而非冠军级别。

2月15日，世界冠军芬兰职业电竞战队 ENCE，将向最强 AI 发起挑战！

参考资料:
DeepMind 技术博客：

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

AlphaStar游戏视频全程录像：
https://www.youtube.com/watch?v=cUTMhmVh1qs

-----------------------------------------------------------------------

《海洋生态大讲堂》微信公众号

浙江省重点智库宁波大学东海研究院合作微媒平台

海洋在说话，您我来代言！

《海洋生态大讲堂》欢迎您！

投稿邮箱：550931758@qq.com

请您在留言中标注为《海洋生态大讲堂》投稿，

并提供个人简历及联系方式。

我们筛选审核后，将以全文刊出！

热烈欢迎广大自愿者合伙参与公众号运营！

附：投稿类型与要求

（1）主题一定是有关海洋生态学内容的稿件；

（2）原创文章，请配必要的图表；

（3）好文推荐，直接发来原文，或请注明出处；

（4）重要会议报道或信息，请附必要图表及其标题说明；

（5）重大项目科研进展，或重大会议学术报告PPT；

（6）重点团队介绍，或重要人物专访。

您的赞赏是我们前行的最大动力

转载本文请联系原作者获取授权，同时请注明本文来自叶属峰科学网博客。
链接地址：https://wap.sciencenet.cn/blog-1721-1160360.html

上一篇：[转载]科学态度应该是什么态度？
下一篇：[转载]孩子为什么需要自然教育？

收藏 IP: 180.168.155.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

叶属峰

扫一扫，分享此博文

全部作者的精选博文

• 海洋生态监控：回顾与展望

中国海洋分享 http://blog.sciencenet.cn/u/ysf6 生态管理缔造美丽海洋

博文

[转载]AI再次完胜人类！DeepMind在星际争霸II中10:1击败职业玩家

AI再次完胜人类！DeepMind在星际争霸II中10:1击败职业玩家

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

叶属峰

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

中国海洋分享 http://blog.sciencenet.cn/u/ysf6 生态管理缔造美丽海洋

博文

[转载]AI再次完胜人类！DeepMind在星际争霸II中10:1击败职业玩家

AI再次完胜人类！DeepMind在星际争霸II中10:1击败职业玩家

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

叶属峰

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)