|
今天推荐张军平教授的人工智能科普书《爱犯错的智能体》,曾连续24次推荐至科学网头条,曾五次进入京东科普读物新书榜前三名。关于人工智能发展趋势的观点曾被《国家治理》周刊、《瞭望》、《科技日报》、《中国科学报》等媒体多次报道。
智能是什么?二十一世纪以来,人工智能有了飞速发展,在各行各业如互联网、安防、多媒体等都有了广泛且有效的应用。但这是否意味着人类就能制造超越人类自身的智能体呢?作者在科普性地介绍了人工智能前沿进展的同时,着重从犯错的角度,浅显易懂地剖析了智能体在视、听、语言等方面存在的各种错觉和犯错。并指出,理解我们很少关注的犯错,才有利于智能体的研究和发展。
书中从分析生物人的感知功能谈起,以生动的例子介绍了人的视觉、听觉、触觉和体觉的解剖学知识及其基本原理。之后又进入人的感情世界,从人的情感、回忆、梦境,一直谈到灵感和错觉。在这个过程中,作者又适时讨论计算机在处理人的感知世界时会遇到的麻烦及处理原则,还不忘介绍一下讨论对象的数学背景。高斯、黎曼、莱布尼茨、庞加莱、爱因斯坦、图灵等大师级人物的名字频频出现。作者不费力地游弋于生命、计算机、数学、物理等几大学科之间,让读者经历一次目不暇接的跨学科科学旅游。再加上一个个有趣的故事,还有诗,画,歌,甚至还有乡愁!这样的科普,很新鲜、很解惑,又易于接受。
国内人工智能领域一线青年专家撰写的关于视听觉感知的通俗科普作品,全书未出现数学公式。
——周志华(南京大学计算机系主任、人工智能学院院长、欧洲科学院外籍院士)
本书别出心裁,从犯错的角度解释了人工智能。展现趣味性的同时,还全面深刻地阐述了人工智能的原理、进展、不足及进一步的思考,是一本值得阅读的优秀科普著作。
——王飞跃(中国科学院自动化研究所教授,平行智能的提出者,IEEE Fellow,AAAS Fellow)
这是一位计算机教授对人类常犯的认知错误所作的生动阐释,作者从自己精通的人工智能专业出发,左手人文,右手科学,上下古今,旁征博引,对于什么是智能这一终极性的问题提供了富有启示性的思考路径。
——严锋(《新发现》主编,复旦大学中文系教授)
目录
简单视觉错觉 / 1
1 视觉倒像 / 2
2 颠倒的视界 / 7
3 看不见的萨摩耶 / 13
4 看得见的斑点狗 18
5 火星人脸的阴影 / 23
6 外国的月亮比较圆 / 32
复杂视觉错觉 / 39
7 眼中的黎曼流形与距离错觉 / 40
8 由粗到细、大范围优先的视觉 / 53
9 抽象的颜色与高层认知 / 61
10 自举的视觉与智能 / 70
11 主观时间与运动错觉 79
听觉、体感和语言 / 89
12 听觉错觉与语音、歌唱的智能分析 / 90
13 视听错觉与无限音阶中的拓扑 / 101
14 我思故我在? / 114
15 可塑与多义 / 122
梦、顿悟与情感 / 133
16 庄周梦蝶与梦境学习 / 134
17 灵光一闪与认知错觉 / 144
18 情感与回忆错觉 / 153
群体智能 / 161
19 群体的情感共鸣:AI 写歌,抓不住回忆 / 162
20 群体智能与错觉 / 169
总结 / 181
21 平衡:机器 vs 智能 / 182
附录 / 201
附录一:深度学习,你就是那位 116 岁的长寿老奶奶! / 200
附录二:童话(同化)世界的人工智能 / 205
参考文献 / 209
图片来源 / 229
序言
智能体和程序体的对话
我在科学网上第一次看到张军平教授写的系列文章《爱犯错的智能体》时,我还以为这里“智能体”指的是人工智能理论或编程中提到的专业名词agent。但当我仔细读其内容时,特别是在从头浏览其内容时,才发现这里的智能体主要指的是人,尤其是生物学上的人。作者说的没有错,人确实易犯错误。书中从分析生物人的感知功能谈起,以生动的例子介绍了人的视觉、听觉、触觉和体觉的解剖学知识及其基本原理。之后又进入人的感情世界,从人的情感、回忆、梦境,一直谈到灵感和错觉。在这个过程中,作者又适时讨论计算机在处理人的感知世界时会遇到的麻烦及处理原则,甚至还不忘介绍一下讨论对象的数学背景。高斯、黎曼、莱布尼茨、庞加莱、爱因斯坦、图灵等大师级人物的名字频频出现。作者不费力地游弋于生命、计算机、数学、物理等几大学科之间,让读者经历一次目不暇接的跨学科科学旅游。再加上一个个有趣的故事,还有诗,画,歌,甚至还有乡愁!以这样的方式来做科普,我还是第一次读到,感觉很新鲜、很解惑,又易于接受。
本书的主角是被称作“智能体”的人,暂时称之为人智能体。人是万物之灵,却也不能避免犯错误,“人非圣贤,孰能无过?”。作者为何用一整本书来讨论这类问题呢? 看来除了分析人的感知和认知功能本身外,作者还试图用人智能体犯的错误来考核另外一个智能体,即机器智能体,简称程序体。如果后者遇到了同样的问题,它能避免犯错吗?人智能体犯错误一般有客观和主观两方面的原因。客观原因可能是面临复杂的环境,包括对手的蓄意欺骗,主观原因则往往可以归结为经验不足或经验有偏差。为什么会把美女看成老太太呢?因为不知道看一幅画可以从多个角度看。为什么会对隐藏在背景中的目标物视而不见呢?因为没有想到画中还会有画。一个正常的人会吃一堑,长一智,变得越来越聪明。这是什么?这就是人智能体积累的经验,以及从经验中提取的理性认识。对此,程序体有一个很好的工具——贝叶斯理论。犯错误好比一个结论不当的贝叶斯推理,说明不是先验有问题,就是驱动先验的似然有问题。一个有丰富先验和可靠选择机制的程序体就不大会犯类似的错误。所以人智能体在感到困惑的时候不妨咨询一下程序体。
把贝叶斯模型比喻为人智能体的经验有一个问题,就是程序体编写的贝叶斯模型都是针对有限前提的,即它只在程序体为它设定的某一类特定环境有效,而人智能体则以它的全部生活和终身经历为其经验支撑。试问程序体能够构造出这样的贝叶斯模型来吗?这可能就是程序体不及人智能体的地方吧。不过贝叶斯理论至今仍是一个活跃的研究领域。随着研究者们向它提出的问题越来越难,要求越来越苛刻,程序体也在一步步赶上来,更深刻的理论和技术不断诞生。2006 年有人提出了结构化先验的概念,力图把程序体中贝叶斯先验涉及的众多概念按人智能体的认知结构组织起来。先验不再局限于某个有限的图结构,而可以是一个时间上无穷的随机过程。更进一步,复旦大学的李斌提出了可学习先验的思想,直接挑战原本属于人智能体的“活到老,学到老”概念。
当然教益还不止这一点。人智能体可以请教程序体的地方还很多。例如我们可以再讨论一下人智能体对隐藏在背景中的目标物视而不见的问题。这次我们考察那条斑点狗。公正地说,斑点狗之所以未能被发现,是因为组成斑点狗的那些斑点是一个离散集合,它们没有连成线条,并且与其他斑点混杂在一起。结果,本来是“庞然大物”(相对于该图像)的斑点狗消失在斑点之中。这是什么问题?这是知识表示粒度的问题。大粒度的一条狗用稀疏的小粒度斑点表示,当然就看不见了。若问程序体这个问题该怎么办?程序体可能回答:“你怎么不用粒度计算呀?”正如张钹院士指出的:“人类智能的一个公认的特点,就是人们能从极不相同的粒度上观察和分析同一问题。人们不仅能在不同粒度的世界上进行问题的求解,而且能够很快地从一个粒度世界调到另一个粒度世界,往返自如,毫无困难。”粒度计算,这个当年扎德(Zadeh)开辟的新领域,如今已经成为人工智能研究者乐此不疲的探索地。适当地调整计算的粒度,或者灵巧地处理大、小粒度之间的互动,也许可以让那只隐藏在斑点中的狗露出原形。
我们再看看本书中所说的视觉自举原理。动物的眼睛在差异巨大的光强变化之间能够迅速自我调整以适应多变的外来光。我原来一直以为人和猫的眼睛在光强变化下的自适应原理是一样的。感谢本书作者指出这两者之间的区别,使我增加了知识。书中也提到了光强的瞬间变化对交通安全的影响。这个问题可能和粒度计算有关,也可能和贝叶斯先验有关。但无
论是粒度计算或贝叶斯先验都无法解决它,因为这不是一个简单的光强调度问题或光强转化问题,而是人智能体同时面对强光和弱光,甚至还有微光时的应对问题。试想,面对漆黑的夜晚里忽然出现的一辆开着远光灯的大卡车,你还能看清楚一只萤火虫吗?幸好,类似的问题计算数学家们早就想到了。有一门学问叫多尺度计算,就是为解决此类问题而诞生的。这
对程序体是个好消息。在传统计算中有时会同时出现极大的数(如几百亿)和极小的数(如几百亿分之一)。如按常规方法则在计算进行时不是前者造成溢出,便是后者被按忽略不计处理。如何使量级差异巨大的数能够恰当地同时处理,这是多尺度计算要解决的难题。当然,数值计算和光强调度(物理)、光强感知(生物物理)之间并没有直接联系,这只是一个类比。但也许可以给我们以某种启发。
通过这些例子或更多的例子,我们可以看到,人智能体和程序体对事物的认知和处理能力实际上是互有短长的。本书作者提到的可解释性问题是一个极好的例子。在求解各种实际问题时,人们往往希望能有一个既能通用建模,又能提供最优解的方法,作者用那位 116 岁的老奶奶做比喻说明鱼和熊掌不可兼得,这个比喻非常贴切。回想在可计算性理论中我们学
到过一些“不可计算”定理(不可解问题的另一种说法)。我认为 116 岁老奶奶的例子给出了不可计算定理的一种崭新版本:“通用建模和最优求解不可同时计算定理”,或者直接称为“鱼和熊掌不可兼得定理”,又称“平猫不确定原理”。作者还提到了扎德在 40 多年前提出的复杂系统“预测和可解释性不相容原理”。由此可以解释深度学习的“最优求解和理性解释不可兼得定理”。上述第一个原理说了一个数学事实,可能会长久存在下去。第二个原理则可能是受我们目前的认识能力所限,不知道将来有没有突破的可能性,至少在某种意义上的突破。
本书谈论智能。虽然并没有正面给出智能或人工智能的定义,但是通过很多生动的例子,作者已经透露了对于此类问题的一些观点。读者可能会注意到,人智能体会做的事情很多,会犯错误的场合也很多,而许多常见的错误却没有收入书中。例如棋手错判对方意图,下棋输了;学生没有领会题意,写作文跑题了;投资者错估形势,炒股大亏,等等。为什么呢?我认为作者表明了这样一个观点。人智能体的智能并不局限于理性思维这样的高级形式。学术界常用的公式:数据→信息→知识→智能(或智慧)只是程序体的一种智能公式。从作者罗列的大量视觉、听觉、触觉、体觉的实例来看,该公式并非对生物人智能的一般性概括。如果注意到视觉、听觉、触觉、体觉并非人类独有,则它们还表明了人以外的生物也可以有
智能。另一方面,如果我们仔细推敲“体感”这一节,可以发现本书并不认为大脑是生物智能的唯一产地。文献中报道的著名仿生机器“大狗”能够在复杂地形上负重快跑,它对身体平衡能力的掌控就模拟了人类小脑的功能。在更广的意义上,人类的脑是一个复杂结构,它的各个部分各司其职。例如脑干要负起维持所在人生命的多种重要责任,包括心跳、呼吸、消化、体温、睡眠等重要生理功能。还有许多条件反射和无条件反射。如果要用人工智能技术构造一个人工生命,对脑干功能的模拟就是必不可少的。这令我们想起了布洛克斯主张的“没有表示的智能”。他凭此还获得了1991年国际人工智能联合大会的计算机与思维奖。
可能有一种解释是:脑干是一种生命现象,它却与智能无关。但是脑干模拟功能是人工生命的一部分,它与人工智能有关。这种解释使我们意外地得到了一个推论:人工智能模拟的是否不仅仅是智能,而可能也泛指某种生命现象?机器鱼不也是这样吗?但是如果这个观点能够成立的话,就会产生一个问题:它是否管得太宽了?人工智能究竟是我们努力的目标?还是我们应该遵循的方法学?我在《人工智能》一书的前言中曾提到学界对于人工智能的态度有愚公派和智叟派之分。愚公派认为总有一天会把人工智能这座大山完全搬走(到那时机器像人一样聪明),智叟派则认为努力挖山不应懈怠,但挖尽之日永远不会来到。我愿意站在智叟派一边,认为人工智能既是一种(无止境推进的)目标,更是一种(应该持之以恒的)方法学。
在结束序言之前我还想说一句公平话。本书名曰《爱犯错的智能体》。人智能体在这里被一系列的故事批得灰头土脸。但是号称万物之灵的人智能体,其智能真的就那么不堪吗?我在这里只指出一点,人智能体固然爱犯错,但是更能容错。为什么某甲能够一眼认出某乙?尽管某乙外表已与当年初见时很不一样。为什么某丙能解决一个复杂的问题?尽管他从来没
有遇到过类似的情况。为什么不同的程序体被设计来处理不同的智能问题?而人智能体却能够处理各种各样的智能问题,尽管他只有一个大脑,其结构还是固定的。所有这些和他们的容错能力关系极大。为公平起见,我建议作者在本书出版后再写一本《能容错的智能体》,至少和本书一样精彩,或者更精彩。
陆汝钤
中国科学院数学与系统科学研究院
2019 年 3 月于北京
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 14:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社