中国海洋分享 http://blog.sciencenet.cn/u/ysf6 生态管理缔造美丽海洋

博文

[转载]AI再次完胜人类!DeepMind在星际争霸II中10:1击败职业玩家

已有 1950 次阅读 2019-2-2 09:00 |个人分类:海洋报道|系统分类:海外观察|文章来源:转载

AI再次完胜人类!DeepMind在星际争霸II中10:1击败职业玩家

来源:集智小编 集智俱乐部 2019-01-25

直播现场


今天凌晨,在 YouTube 和 Twitch 上播出了一系列星际争霸 II 游戏比赛中,谷歌子公司 DeepMind 开发的人工智能系统 AlphaStar,连续10场比赛击败人类。


星际争霸 II 著名的即时战略游戏,这是人工智能在该项赛事中首次与人类顶尖职业选手对战,并取得压倒性胜利。


谷歌放出了两个系列共10场对战视频录像,这10场比赛2018年12月进行的。在这两个系列中,AlphaStar 分别与人类职业选手 MaNa和 TLO 的对战,都已5:0的战绩横扫人类玩家。


最受瞩目的,是今天 AlphaStar 和人类选手 MaNa 的一场直播比赛。比赛中 AlphaStar试图将整个军团作为整体推进,横扫 MaNa 的基地。但 MaNa 在 AlphaStar 基地后方反复骚扰,获得足够的建造时间。虽然 MaNa 曾经被 AlphaStar 多次击败,但在 AI 面前,人类也有学习能力。


尽管 MaNa 发现了 AlphaStar 的漏洞,获得了人类玩家的唯一一次胜利。但 AlphaStar 已经与另一位职业选手 TLO 在比赛中,取得了5:0的完胜。只能说这是挽回颜面的一局。


AlphaStar  与人类选手 MaNa 今晨直播对战视频


全部比赛过后,AlphaStar 在星际争霸 II 中与人类对抗的总战绩是10:1。


DeepMind 研究员 David Silver 在赛后表示,人工智能已经在不同游戏中取得许多标志性的胜利,此前包括国际象棋、围棋、Dota2 等。未来仍有大量工作要做,但将来人们回顾今天,也许会认为这是人工智能跨出的重要一步。


在实时影像类电子游戏中击败人类似乎跟人工智能的主要功能无关,但这是一项重大的研究挑战。类似星际争霸 II 这样的游戏,对于电脑来说比棋盘游戏难度更高。


在星际争霸 II 中,人工智能无法观察所有物体的移动从而计算后续行动,而是被要求和人一样,只能通过观察屏幕视域内的物体移动,来做出实时反应。


在与 MaNa 和 TLO 的比赛中,AlphaStar 的平均每分钟动作次数的分布,以及观察与行动间的总延迟时间


TLO 和 MaNa 等职业玩家平均每分钟可以做出数百个游戏动作,但这比现在多数机器人要弱。为了提高系统的反应准确性,AlphaStar 平均每分钟发出的动作只有280次,这比人类职业玩家还要低。原因是 AlphaStar 模仿了人类玩游戏的方式。此外,AlphaStar 的观察和行动之间的平均延迟时间为350毫秒。


但这些没有成为难倒 DeepMind 人工智能系统的障碍。AlphaStar 使用深度神经网络学习星际争霸 II 的完整游戏视频,利用原始游戏数据,以监督学习和强化学习的方式进行训练。


AlphaStar 还使用了多体智能算法(multi-agent learning algorithm)。研究者为智能体(agent)设置了目标(获胜或者仅仅活着),首先通过模仿人类玩家来学习,然后让智能体相互比赛,最强的生存下来,最弱的被淘汰。


AlphaStar 的图形处理可视化


DeepMind 估计,AlphaStar 通过强化学习的方式,已经积累了大约200年的游戏训练时间!


与人类玩家在游戏中对抗的目的并不是在游戏中击败人类,而是为了提升 AI 训练方法,更是为了尝试在类似星际争霸游戏这样的复杂虚拟环境中,建立可运行的 AI 系统,最终实现可以执行任何人类任务的通用人工智能。


因此,重要的不是击败人类,而是通过比赛对 AI 的任务表现进行基准测试。


而 AlphaStar 的这次比赛并非终点。参赛的 MaNa 和 TLO 两位选手虽然是职业选手,但仅仅是优秀职业选手,而非冠军级别。


2月15日,世界冠军芬兰职业电竞战队 ENCE,将向最强 AI 发起挑战!




参考资料:
DeepMind 技术博客:

https://deepmind.com/blog/alphastar-mastering-real-time-strategy-game-starcraft-ii/

AlphaStar游戏视频全程录像:
https://www.youtube.com/watch?v=cUTMhmVh1qs


-----------------------------------------------------------------------

《海洋生态大讲堂》微信公众号

浙江省重点智库宁波大学东海研究院合作微媒平台


海洋在说话,您我来代言!

《海洋生态大讲堂》欢迎您!

投稿邮箱:550931758@qq.com

请您在留言中标注为《海洋生态大讲堂》投稿,

并提供个人简历及联系方式。

我们筛选审核后,将以全文刊出!

热烈欢迎广大自愿者合伙参与公众号运营!


                附: 投稿类型与要求

                (1)主题一定是有关海洋生态学内容的稿件;

                (2)原创文章,请配必要的图表;

                (3)好文推荐,直接发来原文,或请注明出处;

                (4)重要会议报道或信息,请附必要图表及其标题说明;

                (5)重大项目科研进展,或重大会议学术报告PPT;

                (6)重点团队介绍,或重要人物专访。

您的赞赏是我们前行的最大动力




https://wap.sciencenet.cn/blog-1721-1160360.html

上一篇:[转载]科学态度应该是什么态度?
下一篇:[转载]孩子为什么需要自然教育?
收藏 IP: 180.168.155.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 17:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部