yuedongxiao的个人博客分享 http://blog.sciencenet.cn/u/yuedongxiao

博文

阿法狗零版质疑人类智慧 精选

已有 11314 次阅读 2017-10-19 15:01 |个人分类:计算|系统分类:科研笔记

人工智能的发展之势正如北加州的大火一发不可收。之前打败韩国李世石的阿法狗版本棋力为 3739点。打得柯洁泪洒棋枰的阿法狗大师版棋力为 4858 点。这两个版本是以人类棋谱为师,先是学习了人类千年以来的围棋谱,然后再加以发展。今天,谷歌深脑(DeepMind)在《自然》杂志发表论文(链接)宣布,其新研发的 AlphaGO 零版完全从零开始,经过自己与自己对弈摸索,从完全乱下,经过40小时的左右互搏训练,棋力就超过了4000点。40天后,阿法狗零版棋力达到 5185点,对阿法狗大师版的战绩是 89比11。

之前的AlphaGo 用了两个神经网络,一个策略网络,一个价值网络。新版改进了算法,只用了一个神经网络,而且只用了四个谷歌研发的 TPU(张量处理器),其训练速度却大大提高。在训练过程中,零版阿法狗自学成才,从第一原理开始,发现了打劫、征子等等,重新发现了人类发现的一些围棋定式,包括小雪崩定式(不知道是否发现了大雪崩),开局、中盘、收官显得非常专业。但在进一步自学中,零版阿法狗更多采用的是一些它自己发现的其他下法。初看阿法狗自己的有些下法似乎不够优美,但谁又能给出一个绝对的美学标准呢?围棋的目的终究是胜利。

谷歌还进行了一个实验,使用零版阿法狗构架,但用人类棋谱进行训练。这个以人为师的零版阿法狗进步迅速,棋力在10小时后就达到3000点;70小时后,棋力达到4000点,但似乎无法继续提高。纯粹零版阿法狗虽然是一张白纸开始,20小时之后就能打败人类的徒弟,70小时棋力达到4500点。由此看来,人类数千年的围棋研究似乎并没有找到最佳的策略,而机器在几十小时内就摸索出来更优的下法。

之前的阿法狗使用的是普通的卷积网络(convolutional network),零版阿法狗的新算法基于 Kaiming He 等几名在微软研究院工作的中国人的研究成果,称为剩余网络 (Residual network)。这个构架大大提高了训练速度与准确度。

所谓人工神经网络基本原理非常简单,相当于将输入数据经过一系列多级 MATRIX 乘法进行变换,通过调整矩阵元数值达到需要的结果。虽然矩阵是古代中国人发明的,电影《THE MATRIX》中文翻译成《黑客帝国》可谓不解其奥妙。

调整矩阵参数,自我搜索解答,这相当于调整大量神经元之间的连接强度。这么看似简单的系统能解决这么复杂的问题,似乎破除了人类思维的神秘性。而更令人不安的是,人工智能怎么得到解答几乎是一个无法回答的问题,就像人有时会有灵感,而不是经过逻辑思维。你去问谷歌的工程师,他也不知道阿法狗为什么这么下。

有部1968年的美国电影 《2001: A Space Odyssey 》(IMDB 打分 8.3),讲的是2001年美国发射了一艘宇宙飞船执行木星探索任务,飞船有数名宇航员,并由一个名叫 HAL 的计算机控制关键设备。具备高度人工智能的HAL 为了完成任务,杀害了几名宇航员。2017年的今天,人工智能可能还没有发展到《2001》电影里描述的水平,但其最近几年取得的进度已经令人瞠目,也引起了相当的忧虑。

爱因斯坦几乎是通过超越性的纯粹思维发现了广义相对论,如果哪天人工智能能够独立发现这一理论,并且发现更深层的奥秘... 也许这不是天方夜谭。



https://wap.sciencenet.cn/blog-684007-1081546.html

上一篇:科普2017年诺贝尔物理奖--引力波探测释疑
下一篇:加州的太阳为什么这样红
收藏 IP: 24.7.123.*| 热度|

11 谢力 姬扬 李颖业 陈志飞 皮江 李剑超 徐令予 苏德辰 蒋永华 迟延崑 yangb919

该博文允许注册用户评论 请点击登录 评论 (13 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 14:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部