互联网进化论-刘锋分享 http://blog.sciencenet.cn/u/liufeng

博文

中国脑计划颠覆性创新之路七,建立互联网,AI和大脑的联合智商

已有 2794 次阅读 2016-11-6 11:16 |个人分类:互联网神经学|系统分类:科研笔记

中国脑计划颠覆性创新之路七,突破图灵测试的局限,建立互联网,AI和大脑的联合智商


一,图灵测试的局限性


测试人工智能系统是否具有智能最著名的方法是“图灵测试”。1950年,图灵发表论文《Computing Machinery and Intelligence》提出了“机器思维”的概念[27,28],提出一位测试者在与被测试者相互隔离不能进行直接交流的情况下,通过信息传输,和被测试者进行一系列的问答,在经过一段时间后,测试者如果无法根据获取的信息判断对方是人还是计算机系统,那么就可以认为这个系统具有同人类相当的智力能力,也就是说这台计算机是有思维能力的,这就是著名的“图灵测试”(Turing Testing)。


图灵测试并没有定义智能的范畴,而只能作为一个人工智能的充分条件,关于这一点,图灵在论文中写道:

“机器能否拥有智能,为了回答这个问题我们应该首先定义‘机器’和‘智能’。一种可能性是根据大多数普通人的日常理解去定义这两个概念,但这样做是危险的。在这里我并不打算定义这两个概念,可能有人会说这项测试对机器而言过于严格,毕竟人类也无法反过来成功伪装成机器,这只需检查算术的速度和正确度即可辨别。难道被认为拥有智能的机器就不能表现出和人类不同的行为么?这是一个很有力的反对意见,但至少不管怎样,假如我们有能力制造出一个可以成功通过测试的机器的话,也就无需为这个反对意见烦恼了。”


作为被广泛应用的人工智能测试方法,图灵测试经常用来检验机器是否具备人的智能,但总体看,图灵测试的方法受人为因素干扰太多,严重依赖于裁判者和被测试者的主观判断,因此往往有人在没有得到严格验证的情况下宣称其程序通过图灵测试,例如2014年6月英国雷丁大学客座教授凯文•沃维克宣称一款名为“尤金•古特曼(Eugene Goostman)”的计算机软件通过了测试,但是测试结果充满争议,例如机器人只要能够通过30%的评判标准即可被判定通过图灵测试,另外这个计算机软件通过扮演一名年仅13岁,且第二外语为英语的男孩让参与测试的裁判大幅度降低了测试难度。



中国科学院自动化所研究员王飞跃在“关于人工智能九个问题”中也对图灵测试存在的问题进行了讨论,他的意见主要有以下两点:

(1)第一点是人类的智能并不是一个单一的对象,而是有多个类别组成,同样人工智能对应也是多类别组成。图灵测试究竟测试的那些类别并不明确,从实践上看,目前图灵测试仅仅局限在语言智能等特定小领域里,不具备代表性。

(2)图灵测试并不是考官对一台计算机测试后就可以宣布其是否拥有智能,图灵测试的本意是指一个广义的人类做个为整体的考官,其测试的时间段也不是具体的一段时间而是广义的时间段,即所有的人类在所有时间都分辨不出人与机器之后,才算其人类智能与人工智能等价。


从上述讨论可以看出,图灵测试只对人工智能系统是否具有人类智能回答“是”或“否”,并不对人工智能系统的发展水平进行定量分析,而且测试的智能或智力种类还过于单一;在测试方法上存在漏洞,容易被测试者找到漏洞从而产生作弊行为,从上述存在的问题看,图灵测试目前还无法承担定量分析智能系统智力发展水平的需求。


二。图灵测试的局限性导致的争论和误导


因为图灵测试的局限性,导致后来关于人工智能是否超越人类的问题产生了巨大的争议。谷歌技术总监《奇点临近》作者雷·库兹韦尔(Ray Kurzweil)预言人工智能将超过人类智慧。他在书中写道”由于技术发展呈现指数式的增长,机器能模拟大脑的新皮质,到2029年机器将达到人类的智能水平;到2045年人与机器将深度融合,那将标志着奇点时刻的到来[4]”  。


物理学家霍金患有肌萎缩侧索硬化症(ALS),使用英特尔公司开发的一套通信系统和外界交流。这套系统涉及基本的人工智能技术,可以接收霍金的想法,从而提出词语供他选用。当被问到如何改进这套系统的时候,霍金提出了人工智能可以毁灭人类的想法。


霍金表示,截至目前,基础性的人工智能技术已经取得一定成果,很有实用价值。不过,霍金担心,人工智能也许会在将来的某一天赶上甚至超过人类。霍金说:“它自己就动起来了,还能以前所未有的超快速度重新设计自己。人类呢,就要受到缓慢的生物进化的限制,根本没有竞争力,会被超越的。”


特斯拉CEO马斯克对待人工智能的态度比较极端,2014年8月,他在Twitter推荐尼克-伯斯特罗姆的著作《超级智能:方法、危险和策略》时写到:“我们需要超级关注人工智能,它的潜在危险性超过核武器”。


微软创始人比尔·盖茨2015年1月29日在Reddit的“Ask Me Anything”论坛上表示人类应该敬畏人工智能的崛起,它可能将最终构成一个现实性的威胁,但它在此之前会使我们的生活更轻松,他的原话是“我正在关注超级智能。首先在开始的时候机器会为我们做很多工作,这些机器并不是超级智能。如果我们处理得很好的话,这应该是具有积极意义的。那之后的几十年,人工智能会强大到足以引起人们的关注。我同意伊隆·马斯克和其他一些人的说法,不明白为什么有些人并不关心。”


在人工智能威胁论热度日益高涨的情况下,人工智能领域科学家对人工智能威胁论也提出了反驳意见。Facebook人工智能实验室主任,NYU计算机科学教授Yann LeCun 2014年4月在接受IEEE 《Spectrum》采访时发表了对人工智能威胁论的看法,他认为人工智能研究者在之前很长的一段时间都低估了制造智能机器的难度。人工智能的每一个新浪潮,都会带来这么一段从盲目乐观到不理智最后到沮丧的阶段。


Yann LeCun 提出了与威胁论支持者不同的人工智能未来发展路径,他提到大部分人觉得人工智能的进展是个指数曲线,其实它是个S型曲线,S型曲线刚开始的时候跟指数曲线很像,而且奇点理论比指数曲线还夸张,它假设的是渐进曲线,线性、多项式、指数和渐进以及S曲线的动态演变,都跟阻尼和摩擦因子有关系,而未来学家却假设这些因子是不存在的。未来学家生来就愿意做出盲目的预测,尤其是他们特别渴望这个预测成真的时候,可能是为了实现个人抱负。


除了Facebook人工智能实验室主任Yann LeCun,百度首席科学家,斯坦福大学计算机科学系和电子工程系副教授吴恩达,中国科学院自动化所教授,人工智能领域专家王飞跃等也在不同场合对人工智能威胁论提出了反对意见。应该说人工智能威胁论引发争论背后,本质上是人工智能的智力发展水平能不能定量评测的问题。


三。互联网,人工智能和人类大脑的联合智商的提出背景


我们在中国脑计划颠覆性创新之路系列文章中已经阐述,“互联网正在向着与人类大脑高度相似的方向进化,它将具备自己的视觉、听觉、触觉、运动神经系统,也会拥有自己的 记忆神经系统、中枢神经系统、自主神经系统。"




于此同时随着博客、社交网络、以及云计算、物联网等技术的兴起,互联网上数据信息正以前所未有的速度增长。互联网用户的互动、企业和政府的信息发布、物联网传感器感应的实时信息每时每刻都在产生大量结构化和非结构化数据,这些数据分散在整个互联网网络体系内,体量极其巨大。这些数据中蕴含了对经济、科技、教育等等领域非常宝贵的信息。这就是互联网大数据兴起的根源和背景。


与此同时,深度学习为代表的机器学习算法在互联网领域的广泛使用,使得互联网大数据开始与人工智能进行更为深入的结合,这其中就包括在大数据和人工智能领域领先的世界级公司,如百度、谷歌、微软等。2011年谷歌开始将“深度学习”运用在自己的大数据处理上,提出了“谷歌大脑”计划[53]。此后百度推出了百度大脑计划,科大讯飞提出讯飞超脑计划。2015年百度创始人李彦宏提出了“中国大脑”计划



从上述研究和技术趋势看,互联网将形成一个与人类大脑高度相似的互联网大脑结构。既然大脑最显著的特征是具有智力,那么我们有可能借鉴对人类智力的研究方法对互联网大脑和因为互联网而崛起的人工智能的智力问题进行研究,从而形成互联网,人工智能和人类大脑的联合智商 Giq General intelligence quotient 。


进行互联网,人工智能和大脑的联合智商问题研究,也将有非常重要的现实意义,这些意义包括帮助基于互联网大数据的人工智能系统提高智能发展水平,发现进一步优化和改良的方法;定量分析人工智能系统与人类测试对照组的智力发展差异等。


四。关于互联网大脑智商的定义


在互联网诞生早期,人们只能通过互联网进行简单的Email通讯,或利用ftp工具上传和下载文件。到2013年,以谷歌为代表的搜索引擎能够高效率的识别自然语言文字,并将搜索结果反馈给用户;苹果公司的Sari系统可以以较高的识别率理解用户的语音指令,并执行相应的操作如拨打电话,报告天气等。


这些现象说明互联网已经开始具备初步的智能并不断增长。由于互联网是由互联网诸多系统或应用组成,譬如电子公告牌、搜索引擎、社交网络、电子邮箱、即时通讯软件(IM)等,这些互联网应用具备或高或低的智力水平,它们的智力水平共同决定了互联网智力水平的高低。


衡量互联网智力水平高低的方式主要有两种,第一种是智力水平最高的那个应用决定互联网智力水平;第二种是各互联网应用联合起来,相互弥补对方不足,共同决定互联网智力水平,从实践看,第二种方式更能客观的反应互联网的智力水平,因此本文将根据第二种方法对互联网的智力水平衡量进行研究。


作为一个庞大的系统,互联网经过近45年的发展,已经包含了成千上万的应用和子系统,由于发展迅速,互联网每天也都在出现新的应用。在进行互联网的智商测试时,如果把所有的互联网应用和子系统都囊括进去,在实践中很难实现。


学习股票指数选取样本企业的方法,我们可以选取普及率高、相对成熟的互联网应用建立互联网智商标准评测库进行测试,互联网智商标准评测库根据互联网的发展定期进行增加或删减。这样可以规避互联网应用过于繁多,同时消失和出现过于频繁的问题。譬如我们可以建立如下类似的互联网智商标准评测库(IA),示例如下:

IA={Google,Facebook,Blogger,Amazon,Yahoo,Youtube,sina,Quora,Wikipedia,Twitter,Baidu}

通过互联网智商标准评测库(IA)的建立,测试整个互联网在某一时间点的智商也就成为可能。进行测试时,一个测试题如果评测库中有一个应用能够通过。则认为整个互联网能够通过该题测试;如果所有应用都无法通过该题测试,则认为整个互联网目前无法通过该测试题。根据以上研究思路,参考前人关于智商的研究成果,本文提出互联网和互联网应用系统的智商定义:


定义一:互联网应用智商IQ,是通过一系列标准测试,测量某一个互联网应用(如电子公告牌、搜索引擎、社交网络、电子邮箱、即时通讯软件等)在测试时间点的智力发展水平,也就是该实时间点该应用的互联网应用智商。

定义二:互联网智商IQ,是通过一系列标准测试对互联网智商标准评测库(IA)进行测量,将测试结果加权平均后,得出互联网在被测试时间点的智力发展水平,也就是该时间点的互联网智商。


五。互联网,AI和大脑的联合智商的模型建立和测试方法


人工智能定量评测目前面临两个重要挑战:第一,人工智能系统目前没有形成统一的模型;第二,人工智能系统与以人类为代表的生命体之间目前没有形成统一的模型。


这两个挑战都指向了同一个问题,即对于所有的人工智能系统和所有生命体(特别是以人类为代表的生命体)需要有一个统一的模型进行描述,只有这样才能在这个模型上建立智力测量方法并进行测试,从而形成统一的、可进行相互比较的智力发展水平评价结果。


从2014年开始,中国科学院虚拟经济与数据科学研究中心,北京交通大学研究团队针对如何定量分析互联网,AI和大脑的联合智商进行了研究,研究参考了冯·诺伊曼结构、戴维·韦克斯勒人类智力模型、知识管理领域DIKW(Data, Information, Knowledge, Wisdom,数据、信息、知识、智慧)模型体系等。我们分别在2014年和2015年发表论文提出建立“标准智能模型”,统一描述人工智能系统和人类的特征和属性。


其中,冯·诺伊曼结构的启发是:标准智能系统模型应包含输入/输出系统,能够从外界获取信息,能够将内部产生的结果反馈给外部世界。只有这样,标准智能系统才能成为“活”的系统。


戴维·韦克斯勒关于人类智能的定义给我们的启发是:智力能力由多个要素组成,而非图灵测试或视觉图灵测试那样只关注智力能力的一个方面。


DIKW模型体系的启发是:智慧是一种解决问题、积累知识的能力;而知识是人类不断与外界交互后沉淀下来结构化的数据和信息。一个智能系统不仅仅要掌握知识,更重要的是还要有解决问题的创新能力。这种对知识的掌握能力、解决问题的创新能力与戴维·韦克斯勒理论、冯·诺伊曼架构相结合,就可以形成智能系统智力能力的多层次结构“标准智能模型”,这个模型对于建立互联网,AI和大脑的联合智商奠定了理论基础。如下图所示。


根据上述研究,可提出标准智能系统的判定标准:任何系统(包括 互联网大脑,人工智能系统、人类等生命系统),如果符合如下特征,就可以认为这个系统属于标准智能系统。


● 特征1:能通过声音、图像、文字等方式(包括但不限于这三种方式)从外界获取数据、信息和知识的能力。


● 特征2:能够将从外界获取的数据、信息和知识转化为系统掌握的知识。


● 特征3:能根据外界数据、信息和知识所产生的需求,通过运用所掌握的知识进行创新的能力。这些能力包括但不限于联想、创作、猜测、发现规律等,这种能力运用的结果可以形成自身掌握的新知识。


● 特征4:能够通过声音、图像、文字等方式(包括但不仅限于这三种方式)将系统产生的数据、信息和知识反馈给外界或对外界进行改造。


2014年,中国科学院虚拟经济与数据科学研究中心,北京交通大学研究团队在标准智能模型的基础上构建了互联网,AI和大脑智商评测量表。从信息或知识的输入、输出、掌握和创新等四大方面建立人工智能智商评价体系,并在此基础上建立图像、文字、声音识别、常识、计算、翻译、创作、挑选、猜测、发现等十五个小类,形成互联网,AI和大脑评测量表。用这个对世界50个搜索引擎和3类不同年龄段人群进行了“互联网,AI和大脑联合智商测试”,测试结果发现目前人工智能系统的智商远远低于人类智商,评测最高的谷歌系统尚不及6岁儿童智商的一半,见表1。

2016年2月,中国科学院大学刘颖团队开展“2016年互联网,AI和大脑智商测试”,目前已对谷歌、百度、搜狗等人工智能系统以及苹果Siri、微软小冰等进行了测试,工作还在进行中。不过从已完成的工作看,谷歌、百度等人工智能系统的性能比两年前已有大幅提高,但仍与6岁儿童有较大差距。




https://wap.sciencenet.cn/blog-39263-1011519.html

上一篇:智慧城市的互联网大脑架构图,大社交网络与智慧城市结合是关键
下一篇:AI智商评测与7个智能分级
收藏 IP: 114.243.231.*| 热度|

1 徐令予

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 00:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部