应行仁
人机围棋大赛之后 精选
2016-3-16 08:06
阅读:11968
标签:人工智能, 博弈, Alpha, 李世石, 围棋赛

Alpha Go大胜李世石赚足了世人的眼球,被誉为机器与人类的大战,人工智能对人类的挑战从小说电影,被这场围棋赛生动具体地放在人们的眼前,引起了许多的争论和深思。

韩国律师说,Alpha Go集人类无数的围棋经验,动用数百台电脑对李世石的发招,进行了并行运算后下子,相当于围殴,这不公平。他不懂,其实谷歌只是借此来展示软件技术进步,无关公平竞赛和个体荣誉。以计算机硬件发展的速度,用单板机代替几百台电脑的能力,不过是十来年就能办到的事。人工神经网络的AI,也已成功地应用在生活中,关键是想做广告:谷歌领导着潮流。

有些评论,对AI的理解,还停留在符号主义演绎推理智能的时代,认为这机器的判断能力是程序赋予的,是把人类掌握的知识列为规则,让机器在演绎推理中有章可循,机器不过算的快,想的深,不知疲劳而已。这思路确实是上个世纪80年代前AI的主流。1981年,日本曾投入了大量的资金,开始雄心勃勃第五代计算机的研究。然而模仿人类智能的专家系统,在长达十几年探索中,人们认识到有两个根本的问题绕不过去。一是互动(Interaction)问题,符号主义的系统只能模拟人类深思熟虑的理性,机器人发展最需要的是感知、移动、互动,而不是人类最无趣的抽象思维技能。二是放大(Scaling up)问题,想象中无限美好的前景,只限于较窄一类问题的专家咨询,或小尺度游戏问题的演示;将证明过原理的设计原型,应用到实践时,各种复杂因素产生了组合爆炸。人类瞬间都能做出的判断,例如识别人脸,穿过有家具的房间,对计算机都艰难无比。所以沿着符号主义路子的AI,穷尽搜索和启发推理,可以胜任简单的棋类博弈,却难以落子“方寸之间,深不见底”的围棋。

围棋的定式和审时度势,可以归结为模式的识别和应对。这是一种“感性的”或举一反三的联想智能。从上世纪50年代初的Perceptron人工神经网络,80年代由BP算法复兴的浅层网络,到本世纪初构造具有卷积功能网络(CNN)来复合深层网络,无监督和监督的深度学习,都是通过样本的训练,以改变网络中人工神经元间的联接权重,来学习经验。这种联结主义模型产生的是一种下意识的感性智能,与符号主义的理性智能不同,你无法将知识直接输送给它,它也无法告诉你,凭借着什么特征或规则得出了具体的结论,它却像经验老道的高手,对熟悉的情况能够做出明智的判断。人工神经网络的技术,已经广泛地应用在我们的生活中。2014Facebook,应用9层神经网络的深度学习方法,对人脸的识别率可达到97.25%,而在电话答复系统,iPadSiri中,各种代替人力的语音辨识技术已被广泛地应用。机器在模拟视觉和听觉的辨识能力上已经非常接近于人类了。

Alpha Go的技术核心是基于神经网络的深度学习,用了3000万步的职业棋手棋谱来训练对棋势的“悟性”。这次的比赛,只不过是以轰动的形式,告诉人们联接主义AI的进展。

Alpha Go对李世石的胜利,让许多人深思后毛孔悚然。在四五十年前,专家系统的AI时代,人们曾好奇地问,计算机会比人类更聪明吗?智能机器人会反叛吗?有知识的人那时都很淡定:机器是在人类制定的规则中行事,其智慧不外是在人赋予的知识内进行逻辑推理,可以规定机器人三定律,第一法则是“机器人不得伤害人类,……”。对那时的AI可以这么想,但如今深度学习的联结主义机器,完全在模仿脑子的功能,虽然现在还需要我们帮助构建先天的联接拓扑和挑选训练的内容,实现的还只是人类智力的某项功能,离综合智能还很远,但不难想象今后具有更快速度更大容量,能够在互联网中自学的机器。令人忧虑的是,这种联结主义机器的脑子是个黑箱,它是怎么想的,知道些什么,为什么会这样想,我们都无法了解和控制。即使拆开硬件,企图分析具有亿万联结的数据也无济于事。

生物在某些智能上超越人类的很多。在辨识方面,狗的鼻子远比人灵敏,很多动物在地震前都能警觉,凶猛动物判断速度调整机体预测反应的能力,都胜过人类,我们对此欣赏而不忧虑。人造的机器,其力量速度和精确性是人类不可比拟,计算机的计算推理能力超越了人类,我们也泰然处之。这些不可怕,因为在人类的智慧面前,它们都是可控的。我们为什么这么担心AI?

圣经里说,全能的上帝创造了人类,无忧无虑无知无识地生活在伊甸园里,直至受到蛇的诱惑,吃了智慧果后知善恶,自己能够做判断,这越出上帝指导的企图,引起造物主的震怒,便成为人的原罪。今天的人类凭借着智慧发展了科技,也扮演着上帝的角色,建造伊甸园,圈养宠物,创造机器。当人造的机器拥有智慧也能独立判断,不再对人唯命是从时,我们能够在机器预埋原罪的观念,用圣经教化它们吗?西方人的忧虑来自其文化深处信念的自省:人因智慧成为万物之灵,替代了上帝主宰着世界,害怕当机器的智力超越人类时,我们将如何自处。以致于有人大声疾呼:要禁止AI的研究,它终将会奴役人类!

但这只是一元神文化孕育出的创造与驯服的思想模式。信奉绝对力量的征服。中国传统文化,深思过人与环境和谐相处之道,在那里没有全能全知的神,人也从未真正统治过世界,着眼于胜负之技只是工博弈之“术”,逆天而行不可为,而知天意则要悟其“道”。既然忧心于人类与机器智能的冲突,那就从博弈之道来看未来吧。

智能作为动物的一种本能,确是为自然竞争而进化来的。模式识别为生存博弈之所需,识别环境分辨敌我和伪装欺瞒,都是竞争中的智能,在生物识别和欺瞒的博弈中,双方都是以最小的代价争取最大的收益。在机器识别技术与客户欺瞒智力的博弈中,双方也依对手而采用恰当代价的策略。所以技术的升级是在博弈中交互变化的,道高一尺魔高一丈。

象棋围棋只是固定规则限制手段的一种博弈,在生存发展进化中,环境目标能力手段是多变的。机器能否识别任何的模式,发现其行为的规律?其实这也是人类科研的梦想。这可能吗?

感知只是事物的部分属性,所以识别只能是部分地确定,而模仿总是可能的。识别和欺瞒的对抗竞争中,智能的升级没有止境,意味着识别不总是可能。事物的规律是行为的模式,从博弈的观点,博弈的结果由局中各方的策略而定,没有一方能单独决定结果。无论是机器还是人,一旦有了自主的意志,对方就无法确定其行为,也就无法把握规律和结果。博弈总是以不对称的优势取胜,所以识别模式和掌握规律总是有限度和暂时的。

能否通过学习渐进逼近被识别的模式?这取决于它所在的博弈局势。例如对“少数者胜(minority game)”的局势,获胜的机会在于与众不同。比如说,两条平行车道哪条更挤的问题,或者股市变化的模式,若有确定的答案,局中的其他智者都据此行动,这样原来不挤的车道就变挤了,原来能获利的机会被人下套了,因此这模式就不再是对的了。对许多博弈,没有不变的取胜模式。

因此生存竞争并非仅因智力就能取胜。机器不可能因智力优势便能淘汰人类。

竞争中的博弈并不仅仅是对抗,合作往往是双赢的优势策略。识别和理性也是为合作而生的智能。对于“从众博弈”,即随大流能形成合作互利的局势,必然会出现“路径依赖”的现象。最早被传播的论断,认知或应用,即使不是最合适的,也最终会成为公认正确的模式。山间的小路是这样走出来的,网络语言是这样流行的,键盘的字母分布也是这样成为标准的。这种局势对学习最有利。实际上,有效辨识大部分事物的模式,语言的形成,人类的交流、学习和知识体系的成功,就是基于这类博弈局势上的学习效率。现在机器智能的发展与人类的需求也正是处在这种利于合作的局势。

机器智能的发展,因人类对生活舒适需求而来,如同代替体力劳作的机器发明一样不可抗拒。不难预测人工智能在各项智力活动中将逐一超越人类。奇点到来时,技术的发展将超越人类的理解能力,无法预警其发生。人们因此而恐惧。但是,我们真的已经理解自然和我们生活的环境吗?科学的发展让我们已经习惯于,用种种人为定义的概念和原理,诸如物理概念定律,经济规律,社会理论等等来构造世界的图像,其成功地解释我们观察到的现象,让我们认为真实的世界就是如此,而忽略去无数不能纳入这个图像的事实,以及我们理解能力之外的因素。因此,当机器的智能超越我们的理解时,也不足为奇,我们也很快就有能够自圆其说,来理解这个世界的理论。

也许人们担心的是未来的机器是否会奴役人类。现在的机器智能还是完全依赖于人类来发展的,其“世界观”的形成来自人类的文化的信息样本。人类的文化给予机器智能早期的教育,也将形成将来AI依赖的思想路径。机器的智能靠与人类的合作得以进化,未来的生存竞争会否陷入“囚徒困境”的博弈局面,人与智能机器的未来是陷入征服的恶斗,还是携手合作,取决于我们对机器的心态,对自身的理解和文化的传承。

据说,外星人觉得人类是汽车的奴隶,每天汽车把人吞进去,嬉戏奔跑,休息时再把人吐出来,让人给它洗刷护理,美容保养,辛劳地负责它的生育、提高、修理治疗的终生服务。

 

【说明】此文部分内容摘自我已发表过有关深度学习的专栏文章“智能的进化与博弈”,《中国计算机学会通讯》P50114期,20158月。


相关专题:世纪人机大战:李世石 VS AlphaGo

转载本文请联系原作者获取授权,同时请注明本文来自应行仁科学网博客。

链接地址:https://wap.sciencenet.cn/blog-826653-962903.html?mobile=1

收藏

分享到:

当前推荐数:51
推荐到博客首页
网友评论84 条评论
确定删除指定的回复吗?
确定删除本博文吗?