[敬请读者注意] 本人保留本文的全部著作权利。如果哪位读者使用本文所描述内容,请务必如实引用并明白注明本文出处。如果本人发现任何人擅自使用本文任何部分内容而不明白注明出处,恕本人在网上广泛公布侵权者姓名。敬请各位读者注意,谢谢!
Google AlphaGo 战胜职业围棋手究竟意味着什么?
程京德
就像1997年 IBM 的 Deep Bule 战胜当时的世界冠军、国际象棋特级大师 Garry Kasparov 一样,这次 Google 的 AlphaGo 完胜欧洲冠军、职业二段围棋手樊麾,在计算机围棋程序乃至人工智能领域是一个里程碑事件,并且也仅仅是个里程碑而已。因为 Deep Bule 当年战胜的是当时的世界冠军、国际象棋特级大师,而这次 AlphaGo 战胜的仅仅是欧洲冠军、职业二段围棋手,其水平还远不及世界超一流围棋手,所以,这次 AlphaGo 之胜利的里程碑意义还远不及 Deep Bule 当年战胜 Kasparov。1月27日 Google 公布消息以来,对此事件,媒体上、网上、微信群里众说纷纭,很是热闹。笔者认为,对此事件的过小贬低和过大拔高都是不对的。那么,AlphaGo 战胜职业围棋手究竟意味着什么?这个事件究竟还蕴涵着哪些有趣的问题?本篇随笔试图回答第一个问题,下一篇随笔将回答第二个问题。
说此事件是谷歌的“精心策划的过度营销” (“三个异常,谷歌围棋AI击败欧洲冠军又是精心策划的过度营销”, http://blog.sciencenet.cn/blog-39263-953028.html),显然是过于苛刻,有失公允的。谷歌作为一个商业公司,做事基于商业考虑十分正常,没有商业考虑才是怪事呢。至于是否“过度”,是个评价标准的见仁见智问题。且不说谷歌研发 AlphaGo 算不算真正的科学研究,拿科学研究中的标准来衡量和评价此事是否合适合理,即便是用科学研究中的标准来衡量和评价,也有个“科学不科学”的问题。做科学研究的学者都应该知道,评价一项研究成果,最重要的是要以该项研究的目的和要解决的问题作为出发点来考查。AlphaGo 的谷歌欧洲研发团队 DeepMind 把目的和要解决的问题设定为战胜作为欧洲冠军的职业棋手,这没有什么可指责的地方吧?离开这一目的和问题去指责批评谷歌恐怕才是“不完全符合科学原则”的呢。只要棋手樊麾没有暗地里配合谷歌 DeepMind 团队故意“造局”,那么5局棋的结果足以作为一个合理妥当的实例来说明问题了。实际上,樊麾本人在回答采访时说,“不过我确实下的也不是很好,当然了,下的时候心态也是一个最主要的原因。不管怎么样,AlphaGo 的棋力确实已经很强了。” “这几盘棋呢,可以说我自己发挥不佳,但不能说不是我的真实水平,下得不好。”(“ Google 人工智能围棋的谈访”, 喆理围棋)
另一方面,既然 AlphaGo 和樊麾的比赛实验有“自然”杂志的编辑在现场监督,阐述实验结果的论文又发表在“自然”杂志上,那么,从科学研究的标准来考查论文结论也是理所当然的。这就引出几个有趣的问题:DeepMind 团队的论文(包括参考文献)中是否包含了足够的信息,可以让其它团队仅凭借论文中公布的方法来独立地重复出该项实验的结果?DeepMind 团队是否有意在论文中回避或隐藏了某些本质上重要的信息?本次比赛实验中,樊麾本人以往的棋谱数据是否被 AlphaGo 在训练和实战中有针对性地使用了?樊麾本人比赛当时的心态起伏究竟在5局中对胜负的影响有多大(或者换个更学术的问法,本次比赛实验的结果是否需要从心理学角度来解释和评价)?
此次 AlphaGo 完胜樊麾,在世界范围内引发了种种为深层学习技术乃至人工智能叫好的欢呼声,其中不乏对此事件的过大拔高。另一方面,或许霍金、马斯克们又会借此事件杞人忧天地渲染“人工智能威胁人类”的谬论(实际上,有些他们的追随者们已经在做了)。这就需要我们正确地准确地解释和评价此事件,以便清楚地认识到此事件的历史意义。笔者认为,此次 AlphaGo 完胜樊麾(实验及论文,“AlphaGo: using machine learning to master the ancient game of Go,” Demis Hassabis, Google Official Blog; “Mastering the game of Go with deep neural networks and tree search,” D. Silver et al., Nature)向我们揭示了如下基本事实:
(1) 概念分层抽象及知识表达的自动化在围棋这样相对很难的棋类游戏的对局中能够有效地被应用于克服搜索空间巨大所带来的计算复杂性难题;
(2) 计算机围棋程序在多个层次上自学习和自评价是可能的并且是有效的;
(3) 通过使用棋手 (“human experts”) 的大量棋谱以监督学习方式来训练神经网络,AlphaGo 可以有效地提高预测 (“predict”,对此用词笔者有异议但不在此讨论) 人类专家棋手行棋的准确性;
(4) 通过自我对局以强化学习方式来训练神经网络,AlphaGo 自己学会了发现 (“discover”,对此用词笔者有异议但不在此讨论)新策略(“new strategies”,对此用词笔者有异议但不在此讨论);
(5) 让计算机围棋程序具备“自我”成长能力是可能的。
在笔者看来,上述每一个基本事实,在计算机围棋领域都是里程碑性质的成就。另一方面,除去上述基本事实,对于此次 AlphaGo 完胜樊麾、AlphaGo 的能力、深层学习的有效性和一般性、人工智能进展等等所做断言式的夸奖和预测,就都有过大拔高之嫌了。
转载本文请联系原作者获取授权,同时请注明本文来自程京德科学网博客。
链接地址:https://wap.sciencenet.cn/blog-2371919-953445.html?mobile=1
收藏