|
13.7 样本点、特征值与代数数
12月15日消息,谷歌和NASA宣布,通过机器学习技术在开普勒-90系统中发现了该系统的第八颗行星。在所有的已知行星系统中,这一发现使开普勒-90系统的已知行星数量与太阳系不相上下。Google将开普勒望远镜收集的140亿个数据点和图像输入人工智能系统,使用模拟人脑神经元计算方式,推演可能的地外文明星系,推演结果得到了天文学家的验证。要知道这可是在145,000个恒星星系中进行大海捞针。机器通过对行星星系的自我学习和推演,很快就找到了距离地球2,545光年的“Kepler 90”星系多颗行星,远远超过了人类天文学家的能力。科学界认为,多行星的星系的是最有可能发现地外生命体的环境。在人类目前一直的宇宙探索中,绝大部分的恒星仅拥有1个或者2个行星,而像我们太阳系这样拥有庞大家族的星系一度被认为是非常罕见的。现在这个多行星星系的发现非常重要,这次发现被普遍解读为找到了“第二个太阳系”。
机器如何能在浩瀚繁星的数据中,恰如其分找出哪些数据有意义呢?关键在于对样本点的选取。
可能很少有人注意到,采集样本点的实质,就是采集特征值:
AX=αX ,其中阿尔法α代表特征值、X是特征向量、A是矩阵
进一步看,任何一个有理矩阵的特征值都是代数数;并且 ,任何一个代数数也一定是有理方阵的特征根。
大家知道,不同的事物对应于不同的特征属性,在数学上可以理解为一组特征基上的特征值。由于样本点选取数量的差异,表达特征属性的特征基的个数也会不同,这意味着参照系维数的不同。理想化考虑是,以绝对多的维数去度量绝对精确的特征属性;并且,以完备的一组特征基来度量全部算符,这样能确保所有两两算符都有阿贝尔交换性(因为特征值是标量,而标量乘法满足交换律,两个算符有共同特征基上意味着它们的所有投影皆满足交换律)。
不过遗憾的是,所谓绝对多的维数是不可测的,因为可观测的样本点只能是可列的(最多为阿列夫0),而客观世界的特征维度至少是阿列夫2维的(比如量子本征态)。
那么,如果以可列的样本点来表达不可列的特征属性,是否可靠呢?
直观上,电子计算机的离散数字信号似乎能够高保真刻画连续模拟信号。不过,类似压缩技术的有效性,有严谨的理论保障吗?
这里,以阿列夫2维的矩阵力学量子本征态为例。我们知道,海森堡群是局部紧的非交换的幂零李群,这意味着连续可微的傅立叶谱分析。傅立叶分析有一个重要性质,在于其离散样本点取值的不变性:
相似矩阵(等价类)的类特征标(矩阵的迹),与多重线性张量的对偶空间的样本点之和,有深刻内在关系:
可见,以离散样本点来度量阿列夫2维度傅立叶谱量子态空间,是可行性。
进一步,更普遍意义下,如果以离散样本点来度量李群和李代数的张量积空间是否可行呢?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-26 01:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社