|
7.2 多重线性
未来的某一天机器人会不会替代人类成为文明的主人? 由于人类知识水平的局限,我们即无法证明其真、亦无法证明其为假。 这也许是一个对人类认知水平而言无法判定真伪的不可判定命题。关于计算机代替人类的话题,也许目前还只是骇人听闻的哗众取宠的龙门阵。
但是,我们可以确信断定的是,“智能爆炸”的时代正在到来,人机共生系统在可见的未来将会得到极大发展。人类的生活将会越来越依赖机器,甚至如果离开计算机的推演辅助,人类的思维很难从一阶逻辑向高阶逻辑突围。比较打击人类自信心的是,高阶逻辑的广义相对论对于绝大多数普通人完全就是天书,因为普通民众很难理解其中高阶张量的内涵。比如,广义相对论借用二阶张量模型探讨“能量*动量”二阶特征属性,通过高阶张量演算,从而物理学家可以理解到高阶逻辑的玄妙。
我们都知道,没有特征属性(0阶特征属性)的标量之间,是可以任意加减乘除的。有一个特征属性方向(1阶特征属性)的矢量之间,却只定义了缩并为0阶特征属性(内积)的点乘、或者缩并为1阶特征属性的叉乘。如果两个矢量相乘不缩并,本应该是二阶特征属性复合体概念,不过一阶逻辑的自然语言理解不了这种二阶特征属性复合体是啥子东西。
比如“一分钱”是1阶特征属性概念,“椅子”、“桌子”、“电视机”、“电视柜”等也是1阶特征属性概念,把这些1阶特征属性对象两两乘积复合得到二阶特征属性复合体。但是,请问你知道“一分钱乘以一分钱”、“椅子乘以桌子”、“电视机除以电视柜”都是些什么鬼么? 日常一阶逻辑的自然语言根本理解不了这种二阶特征属性复合体是啥子东西。
基于的高阶张量演算到底有多么强大,可以从其n阶m维‘多重线性关系’一窥究竟。
幸运的是,在普通人看来烧脑的高阶张量,用计算机演算却非常简单,只需定义不同的数组类型,然后将对将、兵对兵、钉对钉、卯对卯,对应代数运算即可。
先从一阶张量(即‘向量’)说起,向量是向量空间的元素,向量空间即‘线性空间’,满足下面两个基本数学式子:
φ(x+y) =φ(x)+φ(y)
φ(ax)=aφ(x)
形象理解,x、y相当于元素“种类”,φ是某种“属性”。当一种属性作用到一些种类时,如果满足‘叠加原理’(也就是上面那两个数学式),那么具备这个性质的空间就是线性空间(或者叫向量空间)。
向量空间的元素“种类”可以很多,但其“属性”是单一的。如果我们对向量的“属性”进行扩展,比如具备了φ、ψ两种属性,满足:
(φ+ψ)(x) =φ(x)+ψ(x)
(aφ)(x)=aφ(x)
(φ+ψ)(ax+by)=aφ(x)+aψ(x)+bφ(y)+bψ(y)
这里,双线性的(φ+ψ)(ax+by),即二阶张量(二阶特征属性复合体)
相当于下式:
更复杂一点,可以定义m×n维的二阶张量:
注意,上面两个例子都是矩阵形式,即二阶张量。张量并不仅限于双线性(二重线性),还可以扩张成为三阶(三重线性),象立方体的样子:
并且,还可以继续张量积到四阶(四重线性的四阶特征属性复合体)、五阶(五重线性的五阶特征属性复合体)......无穷阶(无穷重线性的无穷阶特征属性复合体)
(更高阶的张量画不出来,嘿嘿,只有自己想了 )
形象来说,张量就是“高阶向量”、“超级向量”、“广义向量”。因为一个向量只包含单一性质、单一方向、单一特征属性,而一个张量包含了n多性质、n多角度、n多重特征属性
对于初学者来讲,很容易混淆向量和张量的概念,特别是在有限维的情况下。再来看看二阶张量的数学定义式:
(φ+ψ)(x) =φ(x)+ψ(x)
(aφ)(x)=aφ(x)
上面两个式子,很容易化成下面的一个式子:
(φ+ψ)(ax+by) =aφ(x)+aψ(x)+bφ(y)+bψ(y)
咦,如果把φ(x)、ψ(x)、φ(y)、ψ(y)各看成基矢量,这不就是一个向量空间吗?
乍看起来很像,其实不然,因为张量空间中的 φ与x、ψ与x、φ与y、ψ与y 还存在单一属性的向量所不具备的更深层次更复杂的多重偏线性关系。比如(φ+ψ)(ax+by)就是(φ+ψ)与(ax+by)的二重线性,表达了二阶复合特征属性。二重线性(二阶逻辑)与线性空间(一阶逻辑)存在本质不同,多重线性(n阶逻辑)比线性空间(一阶逻辑)要复杂得多。
向量空间(平面矩阵)是单层次线性空间,逻辑结构图如下:
而张量是多重线性映射,逻辑元链接要复杂得多。有些特殊张量可以转换为多层次线性空间,逻辑结构图如下:
进一步看,关于“属性”和“种类”的二重线性,式子如下:
(aφ+bψ)(x+y) =aφ(x)+aφ(y)+bψ(x)+bψ(y)
其中,任意φ、ψ∈ V* , 任意a、b∈F, 任意x、y∈V
请注意上面‘任意’二字,这意味着“种类”可以有无穷多个,“属性”也可以有无穷多个
为了表达方便,称x、y所属的V空间为原空间,则φ、ψ所属的V*空间为原空间的对偶空间。二者单独而言都是线性空间,合计的张量空间满足‘多重线性关系’,具备多重线性映射、多重线性属性。
比如,你买了一篮子水果,水果“种类”包含苹果、梨子、桃子、西瓜、荔枝......
其中,苹果分为红苹果、绿苹果、半红半绿苹果......
其中,红苹果又包含大苹果、小苹果......
其中,大苹果中有些是新鲜苹果、有些是不新鲜苹果......
其中,新鲜苹果又分为南方苹果、北方苹果、美国苹果、泰国苹果......
其中,南方苹果又有甜苹果、酸苹果......
这样的属性细分,是可以无限细分的
..............
其中,梨子分为红梨子、绿梨子、半红半绿梨子......
其中,红梨子又包含大梨子、小梨子......
其中,大梨子中有些是新鲜梨子、有些是不新鲜梨子......
其中,新鲜梨子又分为南方梨子、北方梨子、美国梨子、泰国梨子......
其中,南方梨子又有甜梨子、酸梨子......
这样的属性细分,是可以无限细分的
..............
、、、、、、、、
这样的种类细分,是可以无限细分的
苹果、梨子、桃子、西瓜、荔枝.....等等水果的“种类”是原空间,
颜色、大小、新鲜、产地、味道.....等等水果的“属性”是对偶空间。
形象说,对偶空间即属性空间,以‘属性’本身作为元素。这些属性元素具备线性功能。
进一步深挖这个问题,需要探讨对“属性”的结构度量。
我们知道,一阶逻辑与高阶逻辑的主要区别在于,一阶逻辑不允许量化“属性”,向量空间的“属性”只能是一个单一方向。但客观世界中,事物“属性”并不单一,可能包含了物体的多种品质特性。如何度量“属性”的复杂特征呢?
在张量空间中,‘属性’还可以再扩张,比如把原本是“属性”集合中的“颜色”点概念扩张成一个子集合系统,把 ‘颜色’ 化为一个单独的子属性类。把其中的 ‘红色’ 、 ‘绿色’ 单列成为扩张成一个个子集合。比如 ‘红色’ 子集合中可以包含深红、浅红、粉红、暗红、朱红、猩红等等;如果想更精细,还可以在容许的红光波长范围770~622nm 连续取值。
同样,“种类”也可以进一步扩张。比如,把‘苹果’点概念扩张成一个子集合系统,把 ‘苹果’ 化为一个单独的子种类。 子集合中可以包含红富士、嘎拉、桑萨、红将军、津轻、金冠、红星、红玉、乔纳金 、澳洲青苹等等苹果具体子类;如果想更精细,还可以包含‘苹果梨’等过渡品种。(‘苹果梨’是苹果和梨树木之间嫁接后产生的混合品种)
这样的m个‘子属性’和 n个‘子种类’构成的(m,n) 型张量的空间形式如下:
(m,n) 型的高阶张量比较复杂,下面以相对简单的三阶张量为例,形象看看一篮子水果的三阶张量表达式是什么样子的:
其中,F为水果的“属性”特征空间、f为水果的“种类”特征空间、e是“属性×种类的关系”的多重线性关系下的张量特征空间
二阶特征关系 = 属性 * 种类
二阶张量 = (φ+ψ)*(ax+by)
结合本章第一节的介绍,F、a如果是单属性向量,则关系式 F=ma 说明F、a具备线性关系
但如果F、a是多属性高阶张量,则“点”概念F、a不是线性相关的,而是“系统”概念下的‘多重线性关系’
同理,高阶张量模型中的一篮子水果的“属性”和“种类”,虽然不是线性相关的,但却具备偏线性下的‘多重线性关系’
通过张量,我们可以观察推导系统和系统之间的更加精细广泛的关联。并且,利用张量表达式,把一个收敛数据集合的“系统概念”看作一个“点概念”,能够简单表达一个系统和另一个系统的“关系”。原本复杂的多重线性关系,可以简化为某种容易看清的逻辑轨迹,可以明晰其中的规律性。
因为复杂的对象一般来说我们无法计算,但是局部切割的偏线性可以矩阵量化,这就是阿列夫1维度空间的微积分的基本思想。这个可微分的光滑曲线的局部直线段dx是一个向量,微分dx的全体组成了一个连续无穷维线性空间。进一步,如果多维“属性”都可以依次偏微分,则全体的偏微分的形成了多重线性相关性。这样,我们不只可以研究两个空间之间的一阶线性映射,还可以研究任意多个空间属性分量之间的多重线性映射。
比如,如果能够量化亚马逊河鲟鱼等动物和可可树等植物等不同生物种类的各种不同属性(比如氮、磷、钾养分含量)分量偏线性关系,就可以量化研究亚马逊生态圈的养分如何流动:
又比如,通过偏微分分量(泊松括号)可以表示哥本哈根矩阵力学的运动轨迹:
动量×坐标矩阵(二阶张量)傅立叶变换的形式如下:
高阶的量子态张量空间(高维度傅立叶变换)可以表示如下:
注意,上面这个式子就是未来量子计算机的基本演算模型,它的子式子可以是∞ ^∞ (无穷大的无穷大次方)。其异常复杂的程度,超过想象!
我们知道,高端服务器所依赖的unix操作系统具有多进程并行处理能力,但那其实只是分享时间片段的伪逻辑并行,仍然有不可避免的局限性,因为电子计算机的物理模型仍然是经典物理的字符串。
在三阶、四阶......n阶张量特征基的参照系,特征纬度将突破连续实数所能表达的范围(阿列夫1),即使在理论上,字符串运算的电子计算机也根本无能为力。
但是,基于量子叠加原理的量子计算机,却可能拥有2^n (2的n次方)的并行计算能力。这是质的飞跃,因为当n等于250时,量子计算机可同时并行处理比全宇宙所有原子数目还多的数据。
关于"大数",最早表述在古希腊数学家阿基米德开始,他在理论上提出了一种表示大数的方法:有人认为,无论是在叙拉古城,还是在整个西西里岛或者在世界上有人烟和没有人迹的地方,沙粒的数目都是无穷的;也有人认为沙粒的数目不是无穷的‘但是想表示沙子的数目是办不到的……但是,我要告诉大家,用我找到的方法,不但能表示出占地球那么大地方的沙粒的数目,甚至还能表示把所有的海洋和洞穴都填满了沙粒,这些沙粒总数不会超过1后面有100个零。
在这段文字中,“1后面连续有100个零”即10^100(10的100次方),按数位念作“一万亿亿亿亿亿亿亿亿亿亿亿亿”
10的100次方已然如此恐怖,那么下面这个东东呢?
还有,更多的,更多更多更多的:
这是张量表达的特征纬度允许的。
换句话说,深度学习模型中的神经元(即特征基)可以多达超过全世界所有沙粒的总数。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-27 10:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社