博文

关于不完备性定理和不确定性原理的探讨（十二）（10）

已有 7404 次阅读 2016-12-27 08:36 |系统分类:科研笔记

12.10 换位子的换位子

即将过去的2016，程序猿攻城狮正在开发能够自动识别不同种类的猫、幽灵般自动驾驶的汽车、赚钱高手的智能投顾、打败人类的AlphaGo的深度学习系统。虽然这些系统的表现随着研究的深入正在变得越来越好，但人们始终无法搞清楚背后的逻辑，AlphaGo为什么会下出这步棋呢？

一般我们所说的人工智能，其实说到底就是由一段程序代码组成的复杂运算系统，这个系统能够根据输入数据得出一个运算结果，而这个结果的外在体现就是人工智能。在通常情况下，我们只能看到输入的数据和最终的运算结果，至于中间的运算过程究竟怎样，则一概不知。当一个深度学习模型进行自我学习时，它只能根据研究者输入的数据，提取出关键的信息，并将这些信息按照只有机器自己才能理解的特征方式加以归类和整理，这一过程完全不需要人类的直接参与，人类也无法加以观察和控制。深度学习算法的难点不在于结论本身，结论的优劣很容易验证，真正困难的是如何将这一长串数字翻译成人类能够理解的语言。对于深度学习AI黑箱，人类一脸懵b ，既不知道AlphaGo如何运筹帷幄出妙手，也不知道AlphaGo怎么会晕菜糊涂下臭棋。

据说，日前来自加州伯克利大学和Max Planck信息研究所的科学家们发明了一种全新的图像识别算法，可以解决这一难题。该算法除了能够按照一般的流程对图像信息进行识别并加以标记之外，还能对产生这一标记的原始数据进行记录，并将这一原始数据“翻译”成人类可以理解的语言备份下来，方便研究者们回溯和检查。这一最新算法的重要意义：它能将机器内部的逻辑链条翻译出来展示给人类，而不是简单的仅仅给出一个结论。

其实，要真正理解AlphaGo的思维逻辑，难度非常大。因为深度学习算法依赖的是多重线性的高阶逻辑，而人类语言是线性的一阶逻辑。希望有一天，我们对AlphaGo们知其然并且能知其所以然。而要弄明白深度学习的逻辑过程，erlangen纲领意义的群结构值得深入探讨。

下面我们再来看看前面的谷歌playground.tensorflow深度学习的事例：

图一，5个隐层的参数匹配了一个旋转图形：

图二，3个隐层的参数匹配了同一个旋转图形：

根据erlangen纲领，我们知道图一的5个隐层结构参数集合和图二的3个隐层结构参数集合，由于表达了同一不变特征（旋转图形），所以它们同属于一个变换群。

有：

多隐层结构参数集（输入）= 输出

即：

图一参数集（特征粒子）= 旋转图形

图二参数集（特征粒子）= 旋转图形

设g为群变换,则有

g .图一参数集 = 图二参数集

由:

图二参数集（特征粒子）= 旋转图形

有:

g .图一参数集（特征粒子）= 同一旋转图形

推出：

图二结构和图一结构的复合变换群作用输入 = 同一旋转图形

一个变换群（输入） = 同一不变特征

进一步看，根据erlangen纲领，每一种特征模式识别对应一个变换群。深度学习特征模式识别会面临更普遍意义下的更多层次性的亚属性。比如，怎样识别波斯猫、狸花猫、缅甸猫、暹罗猫、长毛猫、短毛猫、公猫、野猫、白猫、黑猫等等“猫类亚属性”呢？

图一结构：

图二结构：

图二结构和图一结构的复合变换群 作用输入 = 波斯猫亚属性

因为度量“波斯猫”的猫类亚属性的图一结构参数集合和图二结构参数集合属于同一共轭等价类，因此它们相对于母层次的“猫类”群而言，是不变子群（正规子群）。有：

一个变换群（输入） = 同一不变特征

一个变换群的正规子群（输入） = 同一不变亚属性特征

..............

一个变换群的正规子群的正规子群 （输入） = 同一不变亚属性的个体个性特征

如果我们将猫的层次特征属性一层层地扩张：

生物界 --> 动物类 --> 脊索动物门 --> 哺乳纲 --> 食肉目 --> 猫科 --> 波斯猫亚属种

请注意，这种层次特征结构的扩张就是域扩张。

综上所述，深度学习研究对象的整体特征属性、亚属性特征、...个性特征不同层次的特征属性，与不同层次的正规子群 息息相关。请注意特征属性的扩张亦即域扩张，不同层级的子域和子群是一一对应关系。

显而易见，只要了解作用群的正规子群结构，也就清楚了研究对象的不同层次的特征结构。

所谓正规子群，最突出的性质是与母群之间满足“交换性”即：，因此正规子群可以被母群“整除”。

如果确定了一个群的非平凡子群，一定可以取某个该子群外的元素，构造该子群的一个傍集。傍集与子群“平行”（即元素数目相等，不相交），但是傍集并不是群。再取子群和傍集之外的元素继续构造另一个傍集……这样可以将大群进行“整齐的”划分，这就是Lagrange定理。任何大群中的元素都必然属于某一个傍集（子群也算傍集）。这些傍集实际上可以用其中的一个元素作为代表（等价类），换句话说，傍集之集可以看成是一个“低分辨率”的大群，元素被一组一组地“捏”成一个点。一个很自然的想法是这个“低分辨率”的集合（傍集之集）是否仍然是群。对于(Ha)(Hb)=H(ab)(Ha)(Hb)=H(ab)这种乘法运算成立的条件显然是任何a要能穿过H：aH=HaaH=Ha。这里并不要求a和H中每个元素交换，只是要求H中的元素在任意“共轭变换”（g−1hgg−1hg）之后仍然能够落在子群H中。此条件即傍集之集为群的充要条件；并且由此定义一个群的正规子群：即能够使其傍集之集为群的子群，若傍集之集为群则称之为商群。因此，将一个群“粗糙化”舍弃掉一些信息使其变成一个小群“商群”的方法是找一个（非平凡）正规子群；这个过程或许可以命名为一种“除法”，正规子群是“除数”。（显然这里一定能“整除”。）

即：

群 / 正规子群 = 商群

并且因为正规子群是不变子群，因此它可以层层分解：

子群 / 下层次的正规子群 = 下层次的商群

更下层次的子群 / 更下下层次的正规子群 = 更下下层次的商群

........................

换句话说，一个大群往往可以分解为一层层的小群。

对于由群中的一个任意的子群而言，将所有满足aH=HaaH=Ha的元素归到一个集合中，这个集合称为子群H的正规化子，也就是最大的包含H作为其正规子群的子群，记作N(H)N(H)。这个记号似乎可以看成是一个“函数”。

群的运算往往不一定是交换的，当某些元素与其他任何元素的运算都可交换时，些对其他任何元素具有交换性的元素之集是一个群，为大群的中心（中心化子）。中心必定是正规子群，在“共轭变换”下保持不动。

有一种叫做（次）正规序列的群分解，具有特殊意义。

这里有个重要概念“交换子”（李代数研究的就是交换子），交换子一般称为“换位子”，也就是量子力学中的“对易子”。

不同阶的“换位子”具有不同的层次属性，由于这种层次性，“换位子”G(n)可以作为正规序列(或者次正规序列）群分解的工具。

我们知道，量子力学“不确定性”关系相当于“对易子”不为零。另一方面，系统的“完备性”等同于“对易子”为零。

同样的，“换位子”在群中的意义也是一样的。它度量了群结构某层级的完备性问题。

换位子群最突出的性质是，其商群为Abel群：

群 / 换位子群 = Abel群

也就是说，换位子群是正规子群，是不变子群。因此它可以层层分解：

换位子群 / 下层次的换位子群 = Abel群

下层次的换位子群 / 更下下层次换位子群 = Abel群

...............

因为Abel群（即交换群）的“对易子”为零（单位元），所以当（次）正规序列能够最终群分解至单位元时，整个群将具有完全解（完备性）。

转载本文请联系原作者获取授权，同时请注明本文来自陈正茂科学网博客。
链接地址：https://wap.sciencenet.cn/blog-1666470-1023547.html

上一篇：关于不完备性定理和不确定性原理的探讨（十二）（9）
下一篇：关于不完备性定理和不确定性原理的探讨（十二）（11）

收藏 IP: 59.63.28.*| 热度|

当前推荐数：1 推荐人： icgwang

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

陈正茂

扫一扫，分享此博文

etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨（十二）（10）

当前推荐数：1 推荐人： icgwang

该博文允许注册用户评论请点击登录评论 (0 个评论)

陈正茂

全部作者的其他最新博文

全部精选博文导读

相关博文

etreeasky的个人博客分享 http://blog.sciencenet.cn/u/etreeasky

博文

关于不完备性定理和不确定性原理的探讨（十二）（10）

当前推荐数：1 推荐人： icgwang

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

陈正茂

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)