博文

谷歌DeepMind的来龙去脉精选

已有 6487 次阅读 2016-2-5 17:18 |系统分类:科研笔记| 人工智能

近几日人工智能非常热闹，谷歌的Deep Mind人工智能团队在世界权威科学学术杂志《Nature》刊登论文，宣布旗下的Alpha Go人工智能围棋程序击败了欧洲冠军职业围棋二段樊麾（樊麾出生于中国，目前是法国国家围棋队总教练，已连续三年夺得欧洲围棋冠军）。其实，Alpha Go人工智能围棋程序也击败了目前同类优秀的围棋程序中99.8%的对手。

谷歌的Alpha Go人工智能围棋程序基于DeepMind技术，而DeepMind技术着重于深度学习和强化学习，并且能够使得机器实现自主学习。DeepMind并不是谷歌自己创建的，而是，其联合创始人Larry在2014年初以4亿美元收购的一家英国人工智能公司所创建的。DeepMind的创始人是Demis Hassabis，这可是一位计算机天才，但是，很少有人听说过 DeepMind和这位天才。直到现在网上疯炒的各家媒体，依然还是展望人工智能的前景，很少有报道这位天才以及这家公司，也难怪，这真是一家非常低调的公司。

另外，DeepMind 的投资人之一可是大名鼎鼎的 Elon Musk，就是 Tesla 和 Space X的老板，这位牛人向 DeepMind 投资了 650 万美元。谷歌收购的过程也非常有趣，其联合创始人Larry在飞机上听说了这个公司，非常感兴趣。恰巧，Facebook的创始人Mark Zuckerberg也同时对这个小公司产生了兴趣。所以，谷歌收购的过程很漫长，不过最终还是早出手的Larry胜出，这点让Zuckerberg如今仍耿耿于怀。

再来看看DeepMind 的核心技术。现在街头巷尾都在谈论的机器学习，其实这是一个非常宽泛的概念，而其中最酷的分支要算是深度学习（Deeplearning）和强化学习（Reinforcement learning）。深度学习说过多次了，可以参考声学在线以前的文章。强化学习，其实就是一个连续决策的过程，其特点是不给任何数据做标注，仅仅提供一个回报函数，这个回报函数决定当前状态得到什么样的结果（比如“好”还是“坏”），从数学本质上来看，还是一个马尔科夫决策过程。强化学习最终目的是让决策过程中整体的回报函数期望最优。谷歌的DeepMind就将深度学习和强化学习两者的精髓合二为一，提出了深度强化学习。2014年，这个团队就在《自然》杂志发表了Human-level control through deep reinforcement learning的论文，让业界对此充满了期待。

今年三月，Alpha Go将挑战世界顶级围棋高手李世石。樊麾的世界排名是633名，而李世石的排名是第5名。许多专家认为Alpha Go将赢得这场重量级的比赛。如果的确如此，那么AI爆发是否就此拉开序幕，让我们拭目以待！

声学在线：知识，趣味，圈子

网站：soundonline.org

微信：搜索“声学在线”

qrcode_for_gh_2cf338f6c93e_258(1).jpg

转载本文请联系原作者获取授权，同时请注明本文来自陈孝良科学网博客。
链接地址：https://wap.sciencenet.cn/blog-1375795-954669.html

上一篇：苹果为什么总想取消3.5MM耳机接口？
下一篇：人类可以“听到”的引力波

收藏 IP: 124.16.131.*| 热度|

当前推荐数：4 推荐人：姬扬 薛宇 强涛 yangb919

该博文允许注册用户评论请点击登录评论 (4 个评论)

数据加载中...

返回顶部

陈孝良

扫一扫，分享此博文

陈孝良的个人专栏分享 http://blog.sciencenet.cn/u/brygid 谈谈声学，聊聊智能

博文

谷歌DeepMind的来龙去脉精选

当前推荐数：4 推荐人：姬扬 薛宇 强涛 yangb919

该博文允许注册用户评论请点击登录评论 (4 个评论)

陈孝良

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

陈孝良的个人专栏分享 http://blog.sciencenet.cn/u/brygid 谈谈声学，聊聊智能

博文

谷歌DeepMind的来龙去脉 精选

当前推荐数：4 推荐人： 姬扬 薛宇 强涛 yangb919

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

陈孝良

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

谷歌DeepMind的来龙去脉精选

当前推荐数：4 推荐人：姬扬薛宇强涛 yangb919

该博文允许注册用户评论请点击登录评论 (4 个评论)