etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨(十二)(2)

已有 9133 次阅读 2016-6-10 16:30 |系统分类:科研笔记

12.2 聚类


  物以类聚,人以群分。这是大自然最重要的基本规律,也是我们认知大千世界的主要途径。

  在2016年的Google I/O大会上,有许多关于Project Tango的展示,这一项目将利用AR技术改变你看世界的方式,比如为室内AR提供准确的导航,让用户在虚拟世界身临其境交互。看看视频演示:

http://toutiao.com/i6288079469181665794/

   Project Tango对周围的环境和区域绘制,有个技术关键点---“聚类”。




   聚类算法能够把图片中不同种类的物体分类,比如分清哪些像素代表桌子、椅子,哪些是人,哪里代表了墙。

    如何在一大堆数据中抽象出有价值的信息,“聚类”常常不可或缺。

   如果我们把图形中所有的要素看作一个集合,聚类就是根据像素的特性属性异同,把像素分割到一个个不同的子集。对不同子集的不同特性进行分类,然后分别处理之。

   如果正确分类了不同特性的子集,就有望获知图像中隐含的最基本最宏观最框架的结构信息的意义。



   比如,有了整体框架的信息,将很容易从二维图形中还原三维图像。

   前面3.4节,我们提到过“空间折叠”现象是非常值得研究的。因为虽然折叠后的物体已经变形,但某些结构关系却仍然有痕迹。

    我们有可能通过聚类手段,然后分析子类之间的关系,恢复出折叠之前的空间结构面貌:



   以前,不少学者认为将二维平面图像还原到高纬度,只是天方夜谭神话。现在,这个神话在机器学习的处理下,已经变成了现实。

   让我们直观地感受下聚类算法的视觉冲击,下面是斯坦福教学视频,从平面图形中还原三维、四维的图像(可以从52分钟看起)

http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html


 


   聚类是机器学习常用算法。特别是在智能化要求更高的无监督学习领域,聚类算法更是大展宏图施展拳脚处处留影:



   神奇聚类算法的关键在于找到像素间的“共同相似性”,比如像素之间的“距离”:











   聚类的作用不仅仅在于分析图像,在所有的复杂系统中,聚类都有特殊意义。通过“聚类”,能够把杂乱无章一团乱麻,整理归纳聚类清分,然后在宏观角度一目了然。

   比如下面是纽约时报介绍的阿富汗社会结构情况,第一感觉完全是杂乱无章一团乱麻:



    为了突出重点,先把距离远(相关性不强)的元素去掉:



    然后,对元素按照特征属性进行归类:



   如果我们把不同种类的元素标识不同颜色进行归类,那么即使系统结构复杂,链接线路繁多,我们也能在层次分类之后,看出不同类别之间的简洁关系:


    注意,这其实就是聚类算法下的深度学习模型。



   通过把基础要素的特征属性归类,我们可以一目了然复杂结构关系。




    聚类算法下的深度学习模型,是一种复杂系统普遍适用的结构分析方法。







https://wap.sciencenet.cn/blog-1666470-983696.html

上一篇:关于不完备性定理和不确定性原理的探讨(十二)(1)
下一篇:关于不完备性定理和不确定性原理的探讨(十二)(3)
收藏 IP: 218.77.90.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 17:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部