博文

2017人工智能热点回眸

已有 4397 次阅读 2018-2-6 18:10 |个人分类:2018|系统分类:科研笔记

【2017年，人工智能的各分支均取得了一系列研究进展，并在各个领域取得了广泛的应用。其中，本文遴选了人机对战，无人驾驶，计算机视觉，自然语言处理，智能音箱，人工智能医疗，人工智能芯片领域作为代表，回顾了2017年人工智能领域的热点事件。】

0 引言

2017年又是人工智能突飞猛进的一年。在这一年间，人工智能产品更加进入人们的视野和生活的一年，以至于很多人把2017年称为“人工智能应用元年”。国内外高校纷纷增设人工智能相关专业从受到广泛关注人机对战比赛，到惠及人们生活的无人驾驶，智能家居，从基础硬件的人工智能芯片，到人脸识别解锁的手机。人工智能正在从方方面面改变每个人的生活。

1 人机对战

从2016年开始，人机对战就成为了人工智能领域最受关注的话题。2016年3月，谷歌DeepMind推出的AlphaGo就以4：1战胜职业围棋世界冠军李世乭，宣告了机器在围棋领域已经达到了超过人类顶尖选手的水平。在震惊世界一年后，2017年5月，强化后的AlphaGo Master又以3：0战胜世界排名第一的棋手柯洁。经过了算法和模型的进一步优化，AlphaGo已经到了没有人类对手的级别。[1]

图1 AlphaGo Master对战世界第一棋手柯洁

Fig. 1 AlphaGo versus Go player KE Jie who is ranked number one in the world

然而在此之后,DeepMind又在10月推出了围棋软件的又一新力作：AlphaGo Zero。虽然AlphaGo Master能够打败世界第一棋手柯洁，但是他也是依靠了数以千计的人类业余和专业棋手对其进行训练。而AlphaGo Zero却跳过这一步骤，从完全的随机开始进行自我对弈，只用了40天自我学习就超越了花了两年时间训练模型的所有旧AlphaGo版本。DeepMind用这一新成果再一次树立了人机对战的里程碑。AlphaGo Zero通过使用强化学习的新形式，让它能够成为自己的老师。它从一个除了规则以外对围棋一无所知的神经网络开始，通过将强大的搜索算法和神经网络结合，不断地通过自我对弈更新和训练模型，在每一次迭代中，系统的性能都能有所提高，自我对弈的质量也随之提高，从而让神经网络越来越精准。最终达到对自己的每一手棋及其对棋局产生的影响进行准确预测，最终预测游戏的胜者。[2]

除了摆脱了人类数据的影响，AlphaGo Zero还将早期AlphaGo使用的用于选择下一手的“策略网络”和用于预测胜者的“价值网络”结合成一个网络，可以更有效的进行资源利用，并进行模型的培训和评估。随着硬件的发展和算法的优化，我们能够实现更快的运算，让机器拥有更多的自主权，人工智能也以此变得更加的强大和高效。[2]

人类知识并不可靠，人力成本又十分昂贵，AlphaGo Zero能够抛弃这一性价比并不高又十分掣肘的手段，在没有人力投入的情况下达到完全超越人类的表现，确实在人工智能领域迈出了重要重要一步。而单单在围棋领域取得突破，其实也只是处在实现摆脱人类知识，让人工智能具有更高自主性这一目标的初级阶段，类似的技术还可以应用于其他结构性的问题中，例如蛋白质折叠，减少能源消耗或者寻找革命性的新材料等。而在围棋领域实现了打遍天下物理手的人工智能，又将在其他各个领域的人机对战中超越我们，今年1月在德州扑克领域，凯耐基梅隆大学开发的Libratus在人机德州扑克比赛中战胜了四位人类顶级德州扑克玩家，也再一次印证了这一点。[3]随着深度学习的不断发展，我们对人工智能在越来越多的领域战胜人类拭目以待。

2 无人驾驶

由于无人驾驶汽车是现阶段人工智能应用中最能很大程度上改变每个人生活的一个应用，所以一直受到很大的关注。世界很多国家都将无人驾驶视为人工智能应用的一个重要爆发点。

在特斯拉，优步相继将无人驾驶汽车和无人驾驶系统投入市场之后。中国各大公司也在无人驾驶汽车领域奋力追赶。在今年的7月5日的“百度AI开发者大会”上，百度的首席执行官李彦宏以视频连线的方式展示了自己乘坐无人驾驶汽车行驶在北京五环路上的场景。百度的无人驾驶系统被称为Apollo系统。除了能够实现在自家的汽车上实现无人驾驶，百度还试图让其成为一个开放系统。其他的汽车行业和无人驾驶领域的合作伙伴可以将其作为软件平台，帮助他们在自己的硬件系统上开发无人驾驶汽车。现有的Apollo系统已经有600多个开发者在使用。百度希望凭借自己的无人驾驶系统，能够成为汽车界的安卓。在无人驾驶汽车的商用和普及上，百度也是雄心满满。在表示自己在五环路上吃到一张罚单后李彦宏表示：“无人驾驶罚单已经来了，无人车量产还会远吗？”百度计划在2018年7月底，率先对无人驾驶小巴士实现小规模量产及试运营。[4]

其实，无人驾驶巴士的上路测试今年已经陆陆续续在很多国家实行。芬兰赫尔辛基已在16年就投入了自动驾驶巴士线路。今年1月在美国拉斯维加斯，Navya公司投入了为期十天的自动驾驶巴士试验[5]，而同款巴士也在6月与美国密歇根大学投入使用。[6] 在国内，12月在深圳，也有“阿尔法巴”无人驾驶公交车进行了试运行。[7]可见在指定的短途线路上进行低速无人驾驶运行已经没有太多技术难关。

图2 密歇根大学的Navya无人驾驶巴士

Fig. 2Navya fully autonomous shuttle vehivle in University of Michigan

虽然在无人驾驶巴士领域，Navya已经实现了完全的自动驾驶，但是对于无人驾驶小汽车来说，配备安全司机依然是必要的。随着无人驾驶个人汽车的量产和普及进一步提上日程，它们的安全性成为了人们热议的话题。去年特斯拉，谷歌无人驾驶汽车相继发生车祸。今年3月优步也因车祸而暂停了无人驾驶项目的研究。[8]虽然百度大胆的公布了自己的商用计划，但它的安全性也依然受到人们的质疑。在最早开始无人驾驶研究但经过六年还未商用的谷歌面前，似乎更让人怀疑无人驾驶的普及是否为时过早。

虽然无人驾驶汽车已经在上路测试，但仍然有许多可以提高和突破的地方。人工智能研发的门槛也在进一步降低，市场在欢迎每一位有能力的开发者。早在今年3月，微软就将它的AirSim系统进行了开源，主要可以用来训练和测试机器人和无人机等。11月，微软又新推出了汽车模拟系统，使得AirSim系统能够被用做测试无人驾驶汽车系统的安全性。他能够呈现详细的城市三维环境图，搭建一个高度还原的虚拟环境。开发者们使用这一系统在虚拟环境中测试无人驾驶汽车是如何行驶的。以此提高无人驾驶汽车系统的可用性和安全性。微软计划通过不同的传感器，模拟具有更好物理特征的汽车，气象建模以及更多的显示环境来进一步扩展AirSim系统。作为一个开放平台，AirSim的易用性十分强大。它提供了包括C++和Python等多语言的API接口，还能够与其他的机器学习工具共同使用。例如可以使用微软认知工具包（CNTK）一起进行深度增强学习。[9]有如此的开放平台，也能够大大的降低无人驾驶算法的开发难度，让更多人能够参与到人工智能新技术的研发中。

图3 AirSim汽车模拟系统[9]

Fig. 3 AirSim automobile driving simulation system

3 人脸识别

2017年新推出的新款苹果手机iPhone X让人脸识别成为了今年最火的人工智能应用。其实早在2012年，脸部解锁就应用在了三星的Galaxy Nexus上。在这几年中，微软，谷歌，百度，阿里等公司也都在不断推广自己的人脸识别系统。苹果推出人脸识别解锁的手机可以算是人脸识别应用普及的临门一脚。这一现象代表着这一人工智能应用已经发展的足够成熟。除了在手机解锁中，在公安领域，金融领域等各种特定领域都能有非常广泛的应用。

微软的人脸识别竞赛一直被认为是人脸识别领域的顶级赛事。它基于微软的大规模现实世界面部图像数据集MS-Celeb-1M，含有10万个名人的约1000万张脸部图片。[10]在比赛的百万名人识别子命题无限制类（可以自由使用外部数据）中，Panasonic-新加坡国立大学拔得头筹，CIGIT和中科院合作队伍紧随其后，而在有限制类（只使用竞赛提供数据）中，获得第一的队伍是北京猎户星空科技有限公司。[11]在无限制类中，除了算法不同，还有训练模型所用的数据量大小可以影响最后的表现。而在有限制类中，只能使用竞赛提供的数据，这将有限制类的比拼先知道了单纯算法的比拼，难度很高。猎户星空是宜家16年9月刚成立的人工智能公司，一年时间就获得了比赛的冠军，可见我国具有丰富的人工智能人才，整个行业都在以惊人的速度的发展壮大。

4 自然语言处理

继去年微软语音识别系统达到5.9%的错误率，超过人类专业速记员之后。微软今年8月又取得了新的巨大突破，将语音识别的错误率降低到了5.1%。在这一年间，微软改进了基于神经网络的听觉和语音模型，同时引入了CNN-BLSTM（convolutional neural network combined with bidirectional long-short-term memory，带有双向LSTM的卷积神经网络）模型来改善听觉模型。他们通过对整个对话的过程进行历史记录分析，实现上下文感知，能够预测接下来可能会发生的事情，进一步加强了语音识别系统的功能，让系统能够适应对话话题和语境的快速转变。[12]

在自然语言处理方面，机器翻译一直被认为是人工智能应用方面非常难的一个应用。今年9月召开的机器翻译大会（WMT）首次增设了中文和英文间的新闻数据翻译任务。[13]而搜狗语音交互技术中心研发的搜狗神经网络机器翻译（Sogou Neural Machine Translation）系统在[中文-英文]机器翻译任务中获得了冠军。Sogou NMT的模型主题采用了业界主流的神经网络翻译模型：基于循环神经网络（recurrent neural network, RNN）的多层编码器-解码器（encoder-decoder）结构，并带有注意力（attention）模块。早在2017年，神经机器翻译就在大规模翻译任务上胜过了统计机器翻译，将人工智能中的神经网络应用于机器翻译就渐渐的成为了主流。研究者们也开始将关注的重点转向解决更复杂的问题，例如翻译中常见的词对齐、罕见词、长句等难点问题。搜狗团队凭借着在自然语言处理和深度学习方面深厚的积累将翻译的准确性不断提高，成为了今年我国在世界自然语言处理领域的一大亮点。[14]

5 智能音箱

人工智能技术的逐渐成熟也带来了智能设备的快速普及。语音识别和自然语言处理技术准确率的进一步提升，意味着VUI（Voice User Interface）正在成为GUI（Graphical User Interface）之后的新一代交互界面。通过与智能语音助手结合，许多公司都将音箱设定为智能家居的控制中心，越来越多的智能音箱设备如雨后春笋般地进入了市场。

今年9月，亚马逊公司推出了第二代智能音箱家族：Echo、Echo Plus和Echo Spot，分别针对入门需求、智能家居需求以及桌面端的智能音箱需求。主要针对智能家居的Echo Plus内置了配合虚拟个人助理Alexa的全新的智能家居控制中心，其中的routine功能能够用一句自定义的命令控制一连串设计好的动作。例如使用“Alexa，good morning”，Alexa就根据你设定好的节奏进行开灯，播放天气预报，煮咖啡等活动。[15]

图4 EchoSpot,Echo和EchoPlus

Fig. 4 Echo Spot, Echo & Echo Plus

无独有偶，去年十月谷歌推出了首款搭载Google Assistant智能助手的Google Home；今年苹果也发布了智能音箱HomePod。[15]在国内智能音箱市场则是更加激烈，在2015年京东和科大讯飞联合研发的叮咚音箱推出后，今年百度、阿里、联想、喜马拉雅、海尔和小米都陆续发布了智能音箱产品。作为智能家居的控制中心，智能音箱的革新也意味着智能家居的实现和普及正在稳步发展中。智慧生活的实现指日可待。

6 人工智能医疗

医疗影像渐渐成为了人工智能在医疗领域应用的重点。由于医疗行业放射科医生短缺，而医疗影像又是很多病症诊疗的必备基础，使用机器替代人类进行医疗影像分析前景广阔。深度学习作为人工智能的核心，十分适合用来分析影像类数据。今年腾讯推出的人工智能医疗产品腾讯觅影开始落地。腾讯先后和四川、河北等十多家三甲医院建立了实验室达成合作，开展AI影像和AI辅诊量两方面的工作。在早期食道癌筛查中，通过不到4s的诊断时间能达到准确率90%的诊断；在辅助眼科糖网筛查中，糖网识别率能够高达97%。[16]

在技术不断落地的同时，在使用人工智能辅助诊疗方面的研发也在不断的取得新的成果。《Nature》杂志今年1月发表的一篇论文还介绍了一种根据照片分类辨别皮肤癌的算法。[17]这也是人工智能在医疗方面一个非常重要的应用领域。有了人工智能的支持，医生的工作能够变得更简单，更多的人可以享受到更准确的医疗诊断。

7 人工智能芯片

人工智能应用的不断推广也为其核心的人工智能芯片提供了巨大的市场，巨大的运算量对芯片提出了更高的要求。新一代计算芯片可以提供更强大的计算力，同时在集群上实现的分布式计算能够帮助人工智能模型在更大的数据集上运行。据跟踪私人公司交易的服务提供商PitchBook的数据显示，今年，风险投资家已向专注于人工智能芯片初创企业投资了1.13亿美元，几乎是2015年全年的三倍。在人工智能芯片的市场上，智能设备厂商、云计算厂商、传统芯片厂商都纷纷参与了进来。[18]

今年5月，谷歌发布了下一代TPU，可以用于推理和机器训练。苹果也为下一代iPhone设计了自己的GPU。这两款产品都将大大有助于在人工智能应用产品上为用户特定的需求调整硬件，比如谷歌云应用或者苹果的语音助手Siri。传统大型芯片公司也已经推出了人工智能芯片，也希望在人工智能芯片领域分一杯羹。英特尔公司在之前一直没有推出人工智能芯片产品，但其在去年相继收购Movidius，Nervana等人工智能硬件公司。这也就带来了在今年10月推出的特别为人工智能设计的Nervana神经网络处理器（NNP，Nervana Neural Network Processor）。[19]但是他依然没有赶上先一步占领人工智能芯片蓝海的英伟达公司，它将本是被设计来服务于游戏视觉的GPU率先应用在了人工智能上，他的精准入局也让它的无人驾驶汽车应用发展的如火如荼。

图5 因特尔Nervana神经网络处理器

Fig. 5Nervana Neural Network Processor of Intel

英国的Graphcore、美国的Mythic、Wave Computing和Cerebras以及中国的深鉴科技和寒武纪科技等多家芯片创业公司公司，都在为人工智能应用开发新的芯片。今年11月，寒武纪科技公司新发布了新一代人工智能芯片，采用与AlphaGo类似的深度学习技术，适用范围覆盖了图像识别、安防监控、智能驾驶、无人机、语音识别、自然语言处理等人工智能的重点应用领域。[20]随着互联网企业的入局，芯片厂商布局的加速，围绕人工智能芯片的争夺战尤为激烈。

即时成果越来越卓著，人工智能也依然处在飞速发展中。在不远的将来，我们可以用人工智能很大程度上解决影响健康，贫困，教育，政治等各方面的问题。我们可以不用自己开车，可以节约更多的能源，可以消灭恐怖分子，可以更好的诊断疾病，更快的恢复健康。人工智能让我们的生活的更便捷和安全。

参考文献略

本文发表在《科技导报》2018(1)

转载本文请联系原作者获取授权，同时请注明本文来自刘伟科学网博客。
链接地址：https://wap.sciencenet.cn/blog-40841-1098719.html

上一篇：强人工智能是潘多拉魔盒吗？
下一篇：什么是智能？

收藏 IP: 59.64.129.*| 热度|

当前推荐数：3 推荐人：彭真明 刘钢 yangb919

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

刘伟

扫一扫，分享此博文

twhlw的个人博客分享 http://blog.sciencenet.cn/u/twhlw

博文

2017人工智能热点回眸

当前推荐数：3 推荐人：彭真明 刘钢 yangb919

该博文允许注册用户评论请点击登录评论 (0 个评论)

刘伟

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

twhlw的个人博客分享 http://blog.sciencenet.cn/u/twhlw

博文

2017人工智能热点回眸

当前推荐数：3 推荐人： 彭真明 刘钢 yangb919

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

刘伟

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：3 推荐人：彭真明刘钢 yangb919

该博文允许注册用户评论请点击登录评论 (0 个评论)