科学出版社分享 http://blog.sciencenet.cn/u/sciencepress 中国最大的综合性科技出版机构之一,科学家的出版社!

博文

人机大战演绎高等人工智能 精选

已有 4499 次阅读 2016-3-15 08:47 |个人分类:科学书摘|系统分类:观点评述


一场“人机大战”,在围棋业界引发巨大震动的同时,也引起了人们对人工智能的关注。机器庞大的计算量和超快的计算速度远非人脑所能及,而“阿尔法围棋”所展现出的学习能力,亦令人惊叹不已。


围棋中存在随机性、未知性和情绪的好坏,更贴近人们的生活。AlphaGo 虽然计算能力强大,也需要靠对围棋的理解和直觉。而这种理解和直觉,是AlphaGo里的神经网络通过实战锻炼学来的。第四局的对决,好像揭示了有自己的理解和直觉的AlphaGo,也同时又有了自己的情绪。本期小编遴选了钟义信著《高等人工智能原理——观念•方法•模型•理论》,来简要解释模拟人类智能系统的模型的工作过程。



高等人工智能的系统功能模型


这是高等人工智能的系统模型。模型中的符号X代表外部刺激,I代表感知系统在外部刺激作用下所产生的“全信息”,符号G代表系统的工作“目标”(存储在记忆系统内),符号a代表系统知识库所存储的“本能知识和常识知识”,符号b代表系统知识库所存储的“本能知识、常识知识和经验知识”,符号c代表系统知识库所存储的“本能知识、常识知识、经验知识和规范知识”,符号d代表系统知识库所存储的“本能知识、常识知识、经验知识、规范知识以及决策所需的现场感、艺术感和灵感”,符号A代表策略执行单元所产生的“智能行为”(由“智能策略”转换而来)。可以看出,符号abcd在功能上的内涵是十分明确的,在“物理”上的最佳实现方式则可以进一步探讨。


众所周知,外部世界的各种事物无时无刻都在运动,生成各种事物的运动状态及其变化方式(本体论信息),这些本体论信息就成为各种各样的刺激,直接或间接地作用于智能系统的感知系统。脑科学的研究结果已经表明,感觉器官可以感知这些外部刺激的形式参数,获得相应的语法信息(认识论信息)分量。


显然,智能系统没有能力控制外部世界各种刺激的发生,也没有办法完全避免外部世界各种刺激对它发生作用。但是由于智能系统具有自己的“目标”G,感知系统就可以根据这个目标利用后面将要阐述的第一类信息转换原理在脑内生成“不仅反映外部刺激的外在形式(语法信息)、而且反映外部刺激的内在含义(语义信息)和相对本系统目标而言的效用价值(语用信息)的全信息I”,并在此基础上生成体现自己目标要求的“注意”机制,选择出那些与目标G密切相关的外部刺激,抑制或过滤与系统目标不相关或很少相关的各种刺激。


可见,系统“目标”在信息获取这个关口上发挥着极其关键的作用:如果智能系统没有明确的“目标”,“感知和注意”系统就没有“根据”来形成“全信息”和基于全信息的“注意”机制,因而也就不可能具有明确的依据生成“选择有用信息”的能力和“抑制无用信息”的能力,系统就有可能被各种有用和无用的外来刺激所堵塞和淹没。

接着,“感知和注意”系统把已经选择出来的反映外部刺激的形式、内容和效用的全信息I送到记忆系统进行必要的加工处理并存储起来备用。与此同时,全信息又被送到“基础意识”模块,支持“基础意识”的工作。


由于我们把基础意识定义为“本能知识和常识知识支持的心理反应”,因此为了保证“基础意识”模块的有效工作,除了需要由感知系统所生成的反映外部刺激性质的“全信息I”之外,还需要由记忆系统提供的“系统目标”G以及与之相应的“本能知识和常识知识”a的支持。


所谓基础意识模块的反应能力,是指:根据系统提供的本能知识和常识知识a和目标,通过对于(代表外部刺激的形式、内容和效用的)全信息I的处理而生成的合乎本能知识和常识知识道理以及合乎目标的反应能力:应当响应还是不予理会;如果应当响应,那么,根据本能知识和常识知识应当做出怎样的响应?


不难理解,虽然基础意识的“反应能力”和感知系统的“注意能力”都是对全信息所反映的外部刺激所做的某种“选择反应”,但却不是简单的重复,这是因为,二者在认知层次上互不相同:“注意模块”仅仅根据系统目标做出“允许通过还是过滤清除”的判决,比较原则和笼统;基础意识模块的反应则不仅根据系统的目标还要根据系统的本能知识和常识知识来做出判断和产生具体的反应,因而比前者更深刻,也更具体。


基础意识的“反应能力”是高等智能重要的基础环节,这是因为,它的工作正确与否直接影响后续模块以至整个系统的工作:(1)如果某个外部刺激引起了基础意识模块的响应,那么,后续模块就需要自上而下地检验基础模块的响应是否正确:若是正确的反应,就予以确认,并启动后续的情感与理智处理;若是错误的反应,则予以纠正,并启动后续的情感与理智处理。(2)如果基础意识模块对某个外部刺激不能产生合理反应,那就意味着:这个刺激的复杂性可能超出了基础意识的处理能力范围,需要基础意识模块自下而上地提交给情感与理智模块进行更深刻的处理。


根据脑神经科学和认知科学的分析,人类情感处理和理智处理是分别由不同的脑组织承担的:情感处理主要在边缘系统进行,理智处理主要在联合皮层进行。因此,在形成基础意识的响应之后,这个响应连同全信息I将分成两路向上前行:一路进入情感生成支路,在目标G和知识库的“本能知识、常识知识、经验知识”b的联合支持下生成系统对于这个外部刺激的情感判断:是应当爱?还是应当恨?是应当喜?还是应当忧?是应当怒?还是应当乐?另一路进入理智生成支路,在全信息I和知识库的“本能知识、常识知识、经验知识、规范知识”c的支持下生成关于这个外部刺激的知识,进而在系统目标G的引导下基于这些知识生成理智谋略,也就是理解外部刺激的形态、内容和价值,从而形成系统对于这个外部刺激的理智性判断:应当欢迎?为何欢迎以及怎样欢迎?应当反对?为何反对以及怎样反对?应当采纳?为何采纳以及怎样采纳?应当排斥?为何排斥以及怎样排斥?应当躲避?为何躲避以及怎样躲避?应当放弃或者不予理会?


还要注意,虽然情感生成和理智生成这两个支路的目标G是一致的;但是它们所具有的“知识背景”却各不相同:情感生成支路具有“本能知识、常识知识、经验知识”b,理智生成支路具有“本能知识、常识知识、经验知识、规范知识”c。因此,两个支路的工作速度和工作质量(对外部刺激的理解深度)也各不相同:一方面,情感生成支路生成情感的速度一般比较快(因为本能知识、常识知识、经验知识的处理相对而言比较容易),理智生成支路生成理智谋略的速度比较慢(因为除了要处理本能知识、常识知识、经验知识之外,还要通过演绎推理等复杂程序处理规范知识);另一方面,正因为情感生成支路生成的情感只是建立在本能知识、常识知识和经验知识的基础上,往往不是很深刻很全面;而理智谋略生成支路生成的理智谋略是建立在全部知识的基础上,通常比较深刻比较全面。所以,在工作速度上,情感的生成比理智的生成快;但是在工作质量上,理智的判断质量比情感的判断质量高。


那么,为什么高等人工智能系统要形成这样两个不同的支路?这是由人类在长期进化过程中所形成的“安全保障”机制启发而来的:在面临一般刺激的情况下,情感支路生成的结果可以等待和让位于理智支路生成的结果,以便把问题处理得比较周到圆满;但是,如果根据本能知识、常识知识和经验知识的快速判断,系统将面临巨大的紧急险情,这时就应当优先按照情感支路的快速处理结果采取相应的紧急措施,而不能等待理智支路慢条斯理给出的“深刻理解”才采取行动;等到紧急危险缓解之后,再按照理智支路生成的“深刻全面理解”来建立处理善后的策略。这样,智能系统就既可以在危险和紧急情况下及时应急,又可以在正常情况下全面处置。至于由谁确定和怎样确定两者的“优先关系”,这是“综合决策”模块的任务。


情感支路生成了需要表达的情感,理智支路生成了作为决策基础的谋略,综合决策系统的任务就是在综合这两个支路的结果的基础上制定最终策略。这里的综合是一个高度复杂的过程,不仅需要有目标信息G,而且需要有两个支路的结果:在情感支路的结果与理智支路的结果一致的情况下,就直接根据两者的结果,在目标引导下,制定最终的策略;在情感支路的结果与理智支路的结果不一致的情况下,就要区分轻重缓急制定最终策略:在紧急情况下需要充分考虑情感支路的结果;在正常情况下需要尊重理智支路的结果,或者在两者之中采取某种权衡。这里所需要的知识d,不仅应当包含c,而且通常还应当包含综合决策所需要的一些更加高级更加特殊的知识,如决策艺术、直觉、现场感和灵感等。


在制定最终策略以后,需要通过“策略的表示”模块把策略表示成为策略执行模块能够理解和执行的有效形式,便于执行。后者的本质任务是在理解策略的基础上把智能策略转换成为智能行为,作用于待处理的问题,改变问题的状态,使它走向预设的目标状态,完成“认识世界(获得知识)和在认识世界的基础上改造世界(生成策略执行策略实现预设目标)”的任务。


但是,如果策略执行的结果不理想(这是经常会发生的情况),感知系统就要把求解问题的结果状态与目标状态之间的误差情况作为新的信息反馈到“基础意识-情感-理智-决策”系统,从中学习和补充新知、修正和优化策略,改进求解的效果。这种通过反馈学习补充新知和优化策略的过程通常需要进行多次,不断螺旋式上升,直至问题得到满意解决。这是典型的学习过程。


如果通过反馈误差信息、学习新知和优化策略之后,始终无法达到目标,就应当判断“预设目标”可能不尽合理。在这种情况下,需要通过“隐性智能”的机制调整和重新设定“目标”,并通过上述的过程重新寻求解决问题达到新目标的新策略。这个过程体现了“在认识世界和改造世界的过程中既改造客观世界也同时改造自己的主观世界”的道理(至于如何通过隐性智能机制来调整和重新预设目标,如前所说,这里暂不讨论,留待日后进一步的研究)。


需要指出,从感知系统的“注意选择”到基础意识模块的“觉知响应”,再到情感支路的“情感生成”和理智支路的“理智谋略生成(从信息提炼知识,由知识激活谋略)”,反映外部刺激性质的“全信息”经历了智能系统所设置的一道又一道的处理关口,经受了一层又一层的深入剖析。每一道处理关口所进行的每一层处理在深度上都很不相同,结果也很不同,是一个逐层深化和提炼的过程。“注意”模块只依据系统目标G,只关心“这个刺激是否与目标相关”;“基础意识”模块依据本能知识和常识知识a,关心“这个刺激是否符合本能知识和常识知识”;“情感生成”模块依据本能知识、常识知识和经验知识b,关心“如何生成符合本能知识、常识知识、经验知识的情感反应”;“理智谋略生成”模块则是全面依据本能知识、常识知识、经验知识和规范知识c,它所关心的是“如何生成符合本能知识、常识知识、经验知识和规范知识的理智谋略”;而在此基础上,其后的“综合决策”还进一步利用本能知识、常识知识、经验知识、规范知识、决策艺术和直觉灵感等综合知识来综合生成最终的系统智能策略。正是通过这样步步深入和层层升华,才保证了高等人工智能系统的高度智能水平。


不难看出,在高等人工智能系统的整个工作过程中,“记忆系统”发挥着基础性作用。它不仅存储着系统目标G和各种必要的知识(包括本能知识、经验知识、规范知识、常识知识、决策的艺术和灵感知识等),而且存储了由外部刺激所引发的“全信息”以及作为中间处理过程的各种结果。与普通的信息概念不同,“全信息”是语法信息、语义信息、语用信息三个分量的统一体,因此,这里的记忆系统需要以适当的方式存储这个“三位一体”。显然,这里的记忆系统应当包括感觉记忆系统、短期记忆系统、工作记忆系统和长期记忆系统,是一个非常复杂的记忆系统体系。不仅如此,这个记忆系统体系还应当能够根据处理进程需要经常与模型中各个模块(包括感知、注意、基础意识、情感处理、谋略处理、综合决策以及策略执行等模块)发生频繁的交互作用,提供或接受相关的信息和知识,支持高等人工智能系统的全部工作。


还要特别指出,模型中的注意模块、基础意识模块、情感生成模块、理智谋略生成模块和综合决策模块一起共享反映外部刺激与系统目标之间关系的全信息。这样就提供了这些模块之间自下而上和自上而下互相协调的基础,比如,基础意识模块知道什么时候应当自下而上报告“超出自身处理能力的外部刺激”,情感模块和理智模块也知道什么时候应当自上而下检查基础意识模块的工作状况,并适时进入角色,使这些模块能够互相默契配合,而不是各行其是。


总之,高等人工智能系统模型提供了一个具有感知能力、注意能力、基础意识能力、情感生成能力、理智谋略生成能力、情感与理智交互作用的综合决策能力、以及策略执行能力的系统结构。



本文由安静摘编自钟义信著《高等人工智能原理——观念•方法•模型•理论》第5章,内容有删减。



978-7-03-040011-6


高等人工智能原理——观念•方法•模型•理论》旨在创建和阐明高等人工智能的基本理论。全书内容由5篇10章构成。第一篇总论:高等人工智能研究的科学观和方法论,介绍自然智能理论研究的启迪和人工智能研究方法的变革。第二篇高等人工智能的基础理论,介绍全信息理论和知识理论。第三篇高等人工智能的主体理论,介绍感知、注意与记忆(第一类信息转换原理)和意识、情感、理智与行为(第二类信息转换原理)。第四篇高等人工智能与现行人工智能的关系,介绍物理符号系统:规范知识支持的机制主义方法、人工神经网络:经验知识支持的机制主义方法,感知-动作系统:常识知识支持的机制主义方法。第五篇应用问题择要,介绍有关应用的几个共性课题。


用您的手指点亮科学!

欢迎转发分享朋友圈,

您的鼓励是我们前进的动力!

点击文中书名、作者、封面可购买本书。



世纪人机大战:李世石 VS AlphaGo
https://wap.sciencenet.cn/blog-528739-962678.html

上一篇:物尽其用:从天然产物到药物的研发
下一篇:科学出版社3月新书快递(二)
收藏 IP: 124.17.26.*| 热度|

3 曹建军 黄永义 shenlu

该博文允许注册用户评论 请点击登录 评论 (9 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 21:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部