etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨(十二)(9)

已有 9595 次阅读 2016-12-6 09:35 |系统分类:科研笔记

12.9 erlangen纲领

   

   1872年, 23 岁的德国人克莱因在erlangen大学准备了一篇讲稿,这篇讲稿提出一个划时代的观点:每一种几何对应一个变换群, 每一种几何研究的对象是各形体在‘相应变换群下不变’的性质。

   erlangen纲领最为人所知的是关于几何学的纲领,但是实际上远不止此,而是贯穿了几何、代数、复分析、群论和数学物理等多个方面。 erlangen纲领认为数学分成不同的领域、不同的逻辑方法论,只不过是表面的现象,因为数学的核心逻辑思维是统一的。不同学科的各种逻辑,只不过是不同群变化下的表现。比如,从数学上来讲狭义相对论是在lorentz变换群下的不变量理论,而广义相对论则是在一般点变换群下的不变量理论,在这个意义上相对论只是克莱因的《erlangen纲领》的一个应用事例而已。

   erlangen纲领的关键是主张各个分支的逻辑统一,而这种大一统的通用逻辑方法,正是未来通用人工智能模型的理论基础。








   下面我们来粗略探讨erlangen纲领的对于深度学习人工智能的指导思想。 [以下主要内容摘自《Erlangen纲领初阶:从群SL2(R)开始》]

   我们知道“深度学习”是高阶张量,是一种多重线性映射。所以这里借用一个最初阶的多重线性映射---双线性映射(默比乌斯映射)为例:

 

  进一步看,默比乌斯映射的SL2(R)群矩阵g可以分解成:



   其中的矩阵A表示膨胀变换,矩阵N表示左平移作用,矩阵K是旋转变换。









     


   现在,我们考虑某个研究对象(比如圆形)对于默比乌斯映射(膨胀变换、左平移作用、旋转变换的复合变换)的特征属性“不变性”:





   在初等几何中,我们谈论一个图形是否“不变”,指的是“全等”,也就是刚体力学的几何体(长度在欧氏变换群下不变)。这相当于左平移作用、旋转变换的复合变换的“不变性”。这是不变性的第一层含义。

   erlangen纲领思想中,“不变性”可以扩展到第二层含义,比如在上述平移作用、旋转变换加入伸缩变换, 这样就得到更大的 “相似变换群”。对于群论而言,“相似”是一个等价类,构成一个不变子群,标示了‘类’不变的特征属性。比如上图不同半径的圆周, 在相似几何中就被视为同样的一类图形。这时刚体几何中的 “全等”概念,等同于相似变换群下的“相似”。这里的‘不变量’的逻辑概念,由A=B,扩展成了






    在深度学习人工智能中,识别图片猫,也可依此层次逻辑:

    比如,第一层的‘类特征属性’识别,图像可以平移、可以旋转,都视为不变的“全等”的同一只猫:


   第二层的‘类特征属性’识别,扩张增加了膨胀变换,所以“相似”的大小不一的图像,也会被为同一种类的猫





     在实际环境中,深度学习识别猫,可能面临更普遍意义下的更多层次性概念问题。所谓的“猫”,并不是一个绝对意义的“全等”概念,而是具有千姿百态的亚属性。

     那么,怎样把狸花猫、波斯猫、缅甸猫、暹罗猫、长毛猫、短毛猫、公猫、野猫、白猫、黑猫......,都一视同仁的看作有共同特征属性的“猫类”呢?如何抽象出猫的整体的共有属性,而不区分猫的各个分支的亚属性呢?







    换句话说,如何来标示不同层次逻辑的特征属性呢?

    关键在于群!

    表征变换的群G不同,则得到的等价类抽象属性就不同。比如,射影几何、仿射几何是比欧式几何更大的抽象类。在仿射几何里所有的平行四边形都是相同的, 而射影几何的椭圆、抛物线、双曲线都看作是同一种类图形。

   


   



   


   为什么,射影几何中能够把椭圆、抛物线、双曲线看作是同一种类图形,究其根本是因为三者的射影变换群轨道都是圆锥体的表面,而群轨道表征了一个群结构的基本结构。







   


   更进一步,我们甚至还可以考虑更高阶的张量空间,对“圈”的特征概念在更大范围统一。比如,将具有专属结构的“圈”概念看作某个更高阶空间的“点”。而这个更高阶空间应该具备一个适当的结构,从而能够从外部容纳“圈”对象的内部结构性质信息。



  凡是具有等价关系(比如矩阵相似、群共轭:的图形都属于同一类,同一类里的一切图形所具有的共同几何性质必是变换群G下的不变量(类的固有特征属性)。在更高阶空间中,变换群G意义是不同的。也就是说,不同‘类别’的固有特征属性的‘不变性’是相对的,对应于不同层次意义上的变换群G。并且,erlangen纲领指出,群变换层次越高(越是普遍性的),则这种变换下的共同类的不变性质就越稳定。






    不仅仅几何学的圈,还有泛函分析的函数,在不同群变换g下都具有层次抽象的普遍意义。用矩阵的代数不变量来标识圈的几何不变量,深刻揭示了逻辑的普适统一性,而不是各个分支各行其道的逻辑专有性。


  在正交变换群下保持几何性质不变的是欧式几何,在仿射变换群下保持不变的是仿射几何,在射影变换群下保持不变的是射影几何,在微分同胚群下保持不变的是微分几何。将“距离”概念抽象化而提炼出“单比”概念,进一步将“单比”抽象化而提炼出“交比”概念,于是,从欧式几何中舍弃“距离不变”而保留更普遍的“单比不变”,得到仿射几何;从仿射几何中舍弃“单比不变”而保留更普遍的“交比”,得到一般的射影几何。从欧式空间(长度,夹角)到内积空间(模,不严格的夹角)再到赋范空间(范,完全抛弃夹角)也是如此,不断的改良(抽象、提炼),一改再改,但最终改到不能再改时,就完成了一个革命——甚至连范数(最熟悉因而最不愿抛弃的度量或度规)也抛弃了,从不严格的距离发展到不确定的距离(邻域δ,就像前面提到的无穷小量一样不确定),得到了里程碑式的“拓扑空间”的概念。 经由欧式空间的连续函数抽象出度量空间的连续映射,一直到抽象出拓扑空间中的同胚映射,一层又一层的抽象是关键。

  因为抽象所以普适,因为抽象所以一般,因为抽象所以能抓住本质。

  不仅仅几何图形等价关系可以群变换,群变换在代数系统也具有普遍性。除了上面提到的几何图形等价关系,还有各种各样的代数等价关系。例如同余类、商群(以陪集为元素构成的集合)等概念。普遍意义下,对于两个群,不论它们的元素多么地不同,只要运算性质相同,彼此就是同构的,并且可以因此认为是相同的代数对象而不加区别。比如复指数函数,不论膨胀、收缩、转动、反演都可以统一起来;双曲型方程,不论弦振动、声音、流体、电磁波都可以统一起来。


  所谓的学科分支,erlangen纲领看来只是一种错觉。无论是几何、代数、泛函、复指数傅立叶分析,还是相对论、量子力学,不同领域、不同参照系,在高阶张量群结构中有深刻内在联系。







   因为不同层次的群变换,表征了不同层次类别的抽象特征。所以基于群结构的深度学习模型,不仅可以识别一只猫、可以从不同亚属的猫中抽象共同类的特征属性,甚至还可以演算出猫属于一种生物,可以理解猫和狗的类之间的不变内积关系。也就是说,未来群结构的深度学习,将会赋予人工智能普遍意义的“常识”观念。






https://wap.sciencenet.cn/blog-1666470-1018966.html

上一篇:关于不完备性定理和不确定性原理的探讨(十二)(8)
下一篇:关于不完备性定理和不确定性原理的探讨(十二)(10)
收藏 IP: 183.134.71.*| 热度|

1 wangbin6087

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-17 02:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部