etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨(十三)(2)

已有 5399 次阅读 2017-4-2 21:29 |系统分类:科研笔记

13.2 非线性切割

 

 

   先来谈一谈语文逻辑和数学逻辑区别:

   有同学问:事物总是有两面性吗?  

   语文老师答:对!凡事都是两面性的,如同一张纸的两个面。

   数学老师答:不对!比如莫比乌斯面,就只有一个面。



   咋个语文思维和数学思维差别就那么大呢?

   究其根本,因为语文思维(自然语言)是一种形式逻辑【见‘2.6 知道在这里画圈才值钱’章节】,等同于单谓词的一阶逻辑,因而是线性的。

   而数学思维与语文思维的本质区别,在于数学逻辑有时不仅仅是一阶逻辑。比如莫比乌斯面,其逻辑模型比线性逻辑复杂。实际上,莫比乌斯面是一种特殊非线性流形,虽然其局部是线性欧式空间,但其整体并不是单谓词(单基底)线性坐标系所能表达的。由于其中旋量影响,莫比乌斯面包含了纠缠逻辑与,是复合群作用的复合谓词(复合基底张量积,因而不能够简单线性分解。所以说数学思维比语文思维更高阶。[高阶张量的‘高阶’指的是基底多重复合,高阶逻辑的‘高阶’指的是谓词多重复合。]






   其实在一只蚂蚁看来,莫比乌斯面与普通纸面似乎并没有什么区别。蚂蚁在莫比乌斯面上爬行,与在普通平面上爬行基本是一样的。


   这是因为,莫比乌斯面具有局部欧式空间(局部线性空间)特性。


   同样的道理,直觉而言我们总以为地球是平的(天圆地方)。而且,我们拿着平面的城市地图总能准确找到目的地。这是因为,地球具有局部欧式空间(局部线性空间)特性。







 



   但是,因为邻近我们身边大地是平的,就能断定地球一定是平的吗?

    因为莫比乌斯面具有局部线性空间特性,就能断定它的拓扑结构一定等同于欧式空间吗?

    非也!

    因为局部线性特性并不代表整体线性结构。



   大千世界并不总是线性的,而非线性的系统并不能简单线性分解来切割系统

   所以很多时候即使我们熟知道局部细节,也不能保证能一窥全貌。这就如同瞎子摸象,只见树木不见森林。

    那么,有什么方法可以克服线性割裂的局限性,从散乱碎片推导整个体系结构呢?






    借此,说说“流形”。









   







   先举一个通俗易懂的例子。上面每张图片是64×64的灰度图,如果把位图按照列拼起来,就可以得到一个4096维的向量,这样一来,每一张图片就可以看成是4096维欧氏空间中的一个点。因为并不是4096维空间中任意一个点都可以对应于一张人脸图片的,我们可以假定所有可以是人脸的4096维向量实际上分布在一个d维(d<4096)的子空间中。

   如果特定到同一张人脸图片,则意味着更小的子空间属性。我们发现如果所有的图片拍自同一个人脸,不过是在不同的pose和光照下拍摄,如果把pose(上下和左右)当作两个自由度,而光照当作一个自由度,那么这些图片实际只有三个自由度。对于同一张人脸图片的特定子空间,存在一个上下、左右的pose和光照这三个值的数组参数方程,就可以生成出对应母空间的4096维的坐标来。

   换句话说,同一张人脸图片的特定子空间是一个嵌入在4096维母空间中的一个3维流形。实际就是将这个数据集从4096维抽象映射到3维空间中。并显示了其中平面2维的结果,图中的小点就是每个人脸在平面二维空间中对应的坐标位置。其中一些标红圈的点被选出来,并在旁边画上了该点对应的原始图片,可以很直观地看出这两个维度正好对应了两个自由度平滑变化的结果。






  将高维的数据映射到低维,使该低维的数据保持某些内在特性不变(保距离、保内积、保度规、保线元)情况下,反映原高维数据的某些本质结构特征。前提是假设某些高维母空间数据是其低维子空间流形结构嵌入。

   流形分析的目的是将其特定子空间映射回低维特征空间中,揭示其子空间专有属性。

   以下图为例,左边是一个三维数据的分布,右边是降低到二维子空间后的结果。我们可以发现二维的数据更能直观地表示其某些内在特性不变的流形结构。












   借此,谈一谈流形分析对于“深度学习”人工智能的意义。

   我们知道,在深度学习参数训练时,常用的张量偏线性偏导数(梯度下降)分析,有时可能出现无最优值现象,导致模式匹配失效。究其根本,因为大千世界并不总是线性的,而非线性的系统并不能简单线性分解来切割系统,所以很多时候即使我们熟知道局部细节,也不能保证能一窥全貌。








  幸运的是,多重线性映射张量的多层次特征粒子基底,有时上层特征粒子基底是下层特征粒子基底的复合

  比如,7.4 元素和集合的同体’章节所示,张量空间是一个庞大的系综,有些张量其中的某些元素可以看作的‘子集合’(子空间),而收敛的子集合又可以视同“元素”。在张量空间中,“集合”和“元素”有时是同一物体的两个不同层次的概念,只是所表达的逻辑层次不同而“元素和集合的同体”的逻辑,其实质就是“波粒二象性”(粒子性即元素、平面波谱分析就是集合)



   也就是说,量体系的各层次概念间隐含着某种‘父元素’和子空间’相关性(请注意张量基底之间不要求绝对无关,而仅仅要求线性无关)。

   这时,当我们厘清了各层次子空间的嵌套关系,就可以专注于子空间的结构,子空间专有特征属性的流形,将会跃然纸上。由于流形的局部欧式空间(局部线性空间)特性,“深度学习”偏导数(梯度下降)算法将很容易一展拳脚。




   


   特别注意:线性无关的基底之间,并不是绝对无关的!(“线性无关”和“绝对无关”含义并不等同。)

   有时某些基底可能另一些基底的复合作用(不同层次基底之间可能存在复合包含关系,也就是说线性无关”的基底有时是“相关的”。



  比如,在‘12.6 类抽象’章节,我们发现谷歌playground.tensorflow深度学习的演示网页中,识别螺旋样本模型,可以采取多隐层参数集方式。


   上面图示,实际上是多重矩阵乘积:

   FDCBA X = T

   其中,F、D、C、B、A分别是各隐层参数集矩阵,X是基底,T是待识别对象(螺旋模型)。



   上面的参数集是可以完备线性分解的张量。值得注意的是,这里的参数集之所以相对简单,关键是因为螺旋图形对象识别所采用的合适的基本构件。基本构件(X组基底),分别是x1、 x2、 x1平方、 x2平方、 x1*x2、 sin(x1)、 sin(x2)。

   请注意,基底X组包含了单要素x的多重复合作用









   再看‘8.6 深度学习’章节的例子,更复杂的人脸图形识别,采用多层次特征要素的基底edges 、object parts 、object modes 。

   请注意,这里的上层特征要素object parts的基底是下层特征要素edges的基底的复合结构;上上层特征要素object modes的基底是中层特征要素object parts的基底的复合结构














   还有,在‘7.4 元素和集合的同体’章节,我们提到过,在电脑上打字插入字符、增加字符、删除字符等等编辑操作,这需要在打开某个文件时在文件内部操作。但是如果我们想节省时间,希望在文件打开的情况下,一边编辑文字,一边把这个文件本身移入另一个文件夹,可以么?这当然是不可以的,所有的计算机系统都不支持。为什么呢?因为编辑文字是文件的内部属性,移入文件夹是文件的外部属性。两种属性不可同而兼得。

   这里,外部属性和内部属性可以看作“深度学习”模型中的两个不同层次,在不同层次的单层线性空间中有不同的基底,比如‘删除字符’操作是‘内部属性’线性空间的一个基底,而移入文件夹'操作是‘外部属性’线性空间的一个基底。当然,在“深度学习”多层次张量模型,由于删除字符操作和‘移入文件夹'操作处于不同的逻辑层次,因而这两个概念是线性无关的,可以共同作为同一张量系统的基底,因此它们二者都成为‘文件处理系统’的基底。

   请注意这里的上层基底移入文件夹'操作是包含了下层基底删除字符操作复合体














   回过头,我们再来看看莫比乌斯面。前面说过,莫比乌斯面之所以和普通纸面特性相异,是因为它无法完备线性分解无法彻底条块分割)。究其根本,因为莫比乌斯面基本结构中存在旋量纠缠,是隐含了‘旋量*向量’复合体的张量空间。


   同样道理,在‘11.3 复空间的圆’章节我们讨论相对论,发现“时空一体”是不能以向量线性分解来解读的。因为闵科夫斯基四维空间有个维度包含了一个i,这意味着时空一体的四维空间并非普通意义的线性空间,而是隐含了‘旋量*向量’复合体的张量空间。当‘空间维’是实空间的向量(直角坐标系),则‘时间维’是虚空间的旋量(非笛卡尔坐标系)。因为 i平方=-1,所以复空间中的“圆”,相当于实空间的“双曲线”:




   由李群理论可知,实空间O2群流形的圆环,在复空间对应的O(1,1)群流形并不是圆环,而是四条互不相接的线条。如果以李群流形视角审视相对论复空间的圆,一目了然:







   有鉴于李群和其流形边界清晰丁卯分明,也许可以作为非线性切割’非线性系统的有效工具。

   对于很多复杂系统,我们能不能简化问题,凸出复合要素基底中的最主要因素,暂时忽略其中次要因素,从而把复合要素基底偏线性化为单要素基底,然后构造李群,从而把复杂非线性张量系统桥归桥路归路划分为比较清晰的流形呢?




 




http://wap.sciencenet.cn/blog-1666470-1043266.html

上一篇:关于不完备性定理和不确定性原理的探讨(十三)(1)
下一篇:关于不完备性定理和不确定性原理的探讨(十三)(4)

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-12-3 22:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部