|
公元前350年,亚里士多德在其发表的《物理学》一书中开卷就提出了第一性原理:“除非我们熟悉事物的基本条件或基本原理,并且分析它最简单的元素,我们才会真正知道一件事。”在《形而上学》中进一步阐明:在每个系统探索中存在基本命题和假设,这些原则是不能被省略、删除或推翻的。在量子化学中,第一性原理的概念,特指从每个粒子的薛定谔方程开始,从头开始计算系统的能量本征态的方法。在工程和技术领域,第一性原理也被应用于创新和解决问题,例如特斯拉在设计汽车电池时,创始人埃隆•马斯克使用了第一性原理方法。马斯克在2012年接受Kevin Rose采访时阐释了他对第一性原理的理解:“我认为人们的思维过程太受惯例或对先前经验的类比的约束。人们很少尝试在第一性原理的基础上思考问题。”“你必须从基础上建立推理,也就是第一性原理,你看一下基本原理,并从中构建你的推理,然后你看看你的结论是否可行或不可行,它可能会或可能不会与人们过去所做的不同。”
第一性原理强调从头开始,通过基本原理进行推理和解决问题。第一性原理的核心在于探索事物的本质和起源,通过层层剖析,找到最基础的构成要素,然后再从这些要素出发,重新构建事物的全貌。基础物理学作为揭示物质构成和运动规律的基础学科,是一个从实验事实到模型理论不断修正和提高的过程。杨振宁在一个讲座中就曾提出,每门基础物理的研究过程一般都经历四个主要层次,从实验事实$\to$唯象理论$\to$理论架构$\to$数学结构,具有明确的数学结构是一门学科成熟的标志。
那么,基础物理学是否存在第一性原理呢?这正是要探讨的主题。随着认识的深入,我们发现大自然确实受很少几条简单规则的制约,纯粹思维可以把我实在。这些普适原理正是万物理论的核心所在,它们就是相对性原理,最小作用量原理和正则性原理。这三条原理都是不证自明的,也无法彻底地实验验证,但否定它们就相当于在逻辑上否定了客观规律的存在性。由于最小作用量原理和正则性原理在博文《最小作用量原理与星系动力学》和《有限与无限,正则性原理》中已经详细分析过,下面进一步阐明相对性原理的数学内容。
相对性原理最早由伽利略在《关于托勒密和哥白尼两大世界体系的对话》的思想实验明确提出:在一个封闭的船舱内,你不能确定船是静止的还是在作均速移动。这个原理也被庞加莱作为一般自然法则强调过,并于1905年之前就建立了狭义相对论的基本内容。爱因斯坦在发展相对论过程中,以物理方程满足协变性作为普适原理确定下来。但自从狭义相对论建立以来,人们对熟知的那些狭义相对论的运动学基本结论,比如同时性的相对性、时间膨胀和长度收缩等,一直争论不断。关于狭义相对论的理论解释产生了众多分歧和佯谬,都是对相对性原理的理解存在概念上的偏差。
相对性原理本质上是一个数学原理,是对时空度规的限制以及对坐标变换的要求。这样说可能觉得很抽象,不好理解,因此需要再作进一步的具体解释。在《时空与坐标 》的博文中已经介绍过坐标的意义,这里不再重复,下面直接用Clifford几何代数的语言阐明其实质内容,看完就明白怎么回事了。
接着《时空与坐标》的内容,我们继续探讨单位球面上微元几何的数学表示。线元向量$d {\bf s}$和有向面积微元$d {\bf A}$分别为
$d {\bf s} = {\bf e}_1 d\theta+{\bf e}_2 d\varphi =\sigma_1 d\theta+\sigma_2 \sin\theta d\varphi,$
$d {\bf A} = \sigma_1 d\theta\wedge \sigma_2 \sin\theta d \varphi =\sigma_{12} \sin\theta d\theta d\varphi,$
其中${\bf e}_1$表示球面上p点处沿着$\theta$网格线(经线)的协变切向量,而${\bf e}_2$表示p点处沿着$\varphi$网格线(纬线)的协变切向量,标准正交基$\sigma_k$具有算子性质,可以用Pauli矩阵来表示,满足Clifford的几何代数。$\sigma_{12}=\sigma_1\wedge\sigma_2$表示球面面积的方向和单位,单位球面的总面积为
${\bf A}=\oint d {\bf A}=\sigma_{12} \oint \sin\theta d\theta d\varphi= 4\pi \sigma_{12},$
其中$\sigma_{12}$的模值为$|\sigma_{12}|=1$,$4\pi $是球面积的值。
几何代数是描述时空和物理理论的统一语言,下面简介Riemann 几何的 Clifford 代数表述。对于具有不确定度规 $ g_{\mu\nu} $ 的 $ n $ 维伪 Riemann 流形,设其度规满足
$(g_{\mu\nu})\simeq (\eta_{ab}) ={\rm diag}(I_p,-I_q),\qquad (n=p+q)$.
在任一给定点 $ {\bf x} $ 的切空间,我们有一组协变的基向量 $ \{\gamma_\mu\} $ 及其变换
$\gamma_\mu = f_\mu^{~a} \gamma_a,\qquad \gamma^\mu = f^\mu_{~a} \gamma^a.$ (1)
文中我们使用希腊字母 $ (\mu,\nu) $ 作为曲线坐标的指标,拉丁字母 $ (a,b) $ 作为局部正交坐标指标,上下重标表示 Einstein 求和. 上式中 $ f_\mu^{~a},f^\mu_{~a} \in \mathbb{R} $ 为标架系数, $ \gamma_a $ 是该给定点的标准正交基, $ (\gamma^a=\eta^{ab}\gamma_b,~\gamma^\mu=g^{\mu\nu}\gamma_\nu) $ 是余标架. 该点切空间的线元向量为
$d \mathbf{x} \equiv \gamma_\mu d x^\mu=(\gamma_a f_\mu^{~a})(f^\mu_{~b}\delta X^b)=\gamma_a (f_\mu^{~a}f^\mu_{~b})\delta X^b=\gamma_a\delta X^a,$ (2)
其中 $ \delta X^a $ 为给定点切空间中的正交坐标微元,只能确定到一个 Lorentz 变换. 这里所说的 Lorentz 变换不必局限在1+3维时空.
定义了向量的 Clifford 积的向量空间构成一个克利福德代数$ C\ell(\mathbb{R}^{p+q}) $. 其标架或基向量满足以下Clifford 关系
$\frac 1 2(\gamma_a \gamma_b+\gamma_b\gamma_a) =\gamma_a\cdot \gamma_b I=\eta_{ab}I,\qquad \frac 1 2(\gamma_\mu\gamma_\nu+ \gamma_\nu \gamma_\mu)=\gamma_\mu\cdot \gamma_\nu I=g_{\mu\nu}I,$ (3)
其中 $ \gamma_a \gamma_b $ 和 $ \gamma_\mu\gamma_\nu $ 是向量的 Clifford 积, $ I $ 为 Clifford 代数的单位元. 在不至于混淆的情况下,我们可以用1代替 $ I $. 由(1) 和 (3) 我们得到 $ (f^\mu_{~a},f_\mu^{~a}) $ 与度规之间的关系为
$f_\mu^{~a} f^\mu_{~b}=\delta^a_b,\quad f_\mu^{~a} f^\nu_{~a}=\delta^\nu_\mu,\quad f^\mu_{~a}f^\nu_{~b}\eta^{ab}=g^{\mu\nu}, \quad f_\mu^{~a} f_\nu^{~b}\eta_{ab}=g_{\mu\nu}.$ (4)
Clifford 代数与欧氏几何有密切的关系,因此也叫几何代数,其完整的基元素共有 $ 2^n $ 个:
$ I,\quad \gamma_a,\quad \gamma_a\gamma_b,\quad \gamma_a\gamma_b\gamma_c,\cdots, \gamma_1\gamma_2\cdots\gamma_n,\quad (a<b<c<\cdots).$
因此 $ \gamma_a $ 也叫 Clifford 代数的生成元. 由 Clifford 代数的表示定理,我们知道基向量 $ \{\gamma_a\} $ 与由 Pauli 矩阵构造的一组特殊的 $ \gamma $ 矩阵是同构的. 因此,在没有混淆的情况下,我们可以不再区分基向量 $ \gamma_a $ 与其矩阵表示.
由(2) 式我们有
$d {\bf x}^2 = \frac 1 2 (\gamma_\mu\gamma_\nu+ \gamma_\nu\gamma_\mu)dx^\mu dx^\nu =g_{\mu\nu} dx^\mu dx^\nu =\eta_{ab} \delta X^a\delta X^b,$ (5)
$dV_k = d {\bf x}_1 \wedge d {\bf x}_2 \wedge \cdots\wedge d {\bf x}_k =\gamma_{\mu\nu\cdots\omega} dx_1^\mu dx_2^\nu\cdots dx_k^\omega,~~(1\le k \le n),$ (6)
其中 $d {\bf x}$ 和 $d {\bf x}_j$ 是线元向量量, $ d V_k $ 是由 $k$ 个向量 $\{d {\bf x}_1, d {\bf x}_2, \cdots, d {\bf x}_k\}$ 组成的平行多面体的有向体积微元, $ \gamma_{\mu\nu\cdots\omega}=\gamma_\mu\wedge\gamma_\nu\wedge \cdots\wedge \gamma_\omega\in \Lambda^k (\mathbb{R}^{p,q}) $
是有向体积的单位, $ \wedge $ 是 Grassmann 的外积,其定义为
$\gamma_{a_1}\wedge \gamma_{a_2}\cdots\wedge \gamma_{a_k}\equiv\frac 1 {k!} \sum_{\sigma} \sigma_{a_1a_2\cdots a_k}^{b_1b_2\cdots b_k}\gamma_{b_1}\gamma_{b_2}\cdots \gamma_{b_k},~(1\le k\le n),$
其中 $ a_j\ne a_l~(j\ne l) $, $ \sigma_{a_1a_2\cdots a_k}^{b_1b_2\cdots b_k} $ 是置换张量:如果 $ {b_1b_2\cdots b_k} $ 是 $ {a_1a_2\cdots a_k} $ 的偶排列,则它等于1,对于奇数排列,它等于1,否则等于0. 上述公式是所有排列的和;也就是说, 它对所有指标都是反对称的.
为了方便联系几何概念,需要把 Clifford 积转化为 Grassmann 积. 这样如下形式的 Clifford - Grassmann 数
${\bf C}=C_0 I+C_a \gamma^a +C_{ab}\gamma^{ab}+ \cdots+C_{12\cdots n}\gamma^{12\cdots n}$
按矩阵代数构成一个实数域上的 $ 2^n $ 维的超复数系,其中 $ C_0,C_a,\cdots,C_{12,\cdots n}\in \mathbb{R} $. 克利福德代数的范数定义为Gonzalez 范数 $ ||C||=\sqrt[m]{|\det(C)|},$ 其中 $ m $ 是 $ C $ 的表示矩阵的阶. Gonzalez 范数是相似变换下的不变量,关于坐标系的旋转、反射和平移等变换都是不变量. 事实上,对任一给定的酉矩阵,相似变换把一组标准正交基变换为另一组标准正交基. 对任何 Clifford - Grassmann 数 $ A$ 和 $B $,范数满足模乘积律 $ ||AB||=||A||\cdot ||B|| $.
对于现实的 $ 1+3 $ 维时空, Clifford 代数 $ C\ell(\mathbb{R}^{1,3}) $ 的生成元的最低阶复矩阵表示为 Dirac - $ \gamma $ 矩阵
$\gamma^0=\gamma_0=\left(\begin{array}{cc} 0 & I_2 \\ I_2 & 0 \end{array}\right),\qquad \gamma^a=-\gamma_a=\left(\begin{array}{cc} 0 & -\sigma_a \\ \sigma_a & 0\end{array}\right),$ (7)
其中 $ \sigma_a $ 为 Pauli 矩阵. Dirac-$\gamma$矩阵(7)生成 $ C\ell(\mathbb{R}^{1,3}) $ 如下的 Grassmann 基
$ I_4, \quad \gamma^a, \quad \gamma^{ab}=\gamma^a\wedge\gamma^b,\quad \gamma^{abc}=-\epsilon^{abcd}\gamma_d \gamma^{0123}, \quad \gamma^{0123} =-{\rm i} \gamma^5,$
其中 $ \gamma^5={\rm diag}(I_2,-I_2) $, Levi-Civita 符号 $\epsilon^{abcd}$ 采用约定 $\epsilon^{0123}=- \epsilon_{0123}=1 $. 我们有 Clifford - Grassmann 数如下
${\bf K}= s I_4+A_a\gamma^a+ H_{ab}\gamma^{ab}+ Q_a\gamma^a\gamma^{0123} +p\gamma^{0123},$
其中 $ (s,p,A_a,\cdots \in \mathbb{R}) $. $ s I_4\in\Lambda^0 $ 是标量, $ A_a \gamma^a\in\Lambda^1 $ 是一个真向量, $ H_{ab}\gamma^{ab} \leftrightarrow (\vec E,\vec B) \in\Lambda^2 $
是2-向量(bivector), $ Q_a \gamma^a \gamma^{0123}\in\Lambda^3 $ 是一个3-向量(trivector),而 $ p\gamma^{0123} \in\Lambda^4 $ 是一个赝标量. 一般而论,任一 Clifford 代数 $ C\ell(\mathbb{R}^{p,q}) $ 都是一个超复数系.
显然微元向量$d \mathbf{x} = \gamma_\mu d x^\mu$比线元 $ ds^2=g_{\mu\nu} dx^\mu dx^\nu $ 更为基本. 此外,旋量方程还与余标架的矩阵表示 $ \gamma^\mu $ 直接相关. 为了求弯曲时空中旋量场的能动张量,我们需要计算标架的变分 $ \delta \gamma_\alpha $ 与度规变分 $ \delta g_{\mu\nu} $ 的显式关系. 如果知道标架 $ \gamma_\mu $, 由 (4) 或 $ g_{\mu\nu}=\gamma_\mu\cdot\gamma_\nu $, 我们可以立即得到度规张量. 但已知度规求标架就不是一件容易的事了,因为映射 $ g_{\mu\nu}\mapsto \gamma_\alpha $ 是多值的,而且还包含一个任意的关于标准正交基的 Lorentz 变换 $ \delta {X'}=\Lambda \delta X $. 如果固定 Lorentz 变换,则映射$ g_{\mu\nu} \mapsto \gamma_\alpha $ 具有一些连续的双射分支. 因此在一个双射的连通区域 $ D $,可建立起连续可微的一一对应$ g_{\mu\nu} \leftrightarrow \gamma_\alpha $. 如果再引入基向量的微分算子,也就是联络算子 $ {\mathfrak{d}} _\mu\gamma^\alpha = K^\alpha_{\mu\nu} \gamma^\nu $,以上的表述能够大大简化微分几何中的很多概念和运算.
上面的这套操作流程就是相对性原理的数学表述,本质上反映的是坐标和物理量以及方程组在坐标变换时的协变性。由于几何代数的对称性限制,基本物理场量只有标量、旋量、矢量和度规场以及衍生出来的2-向量、3-向量等几种类型。结合最小作用量原理和正则性原理,物理学的内容就基本上圈定了。如果再结合其他工作假设和具体条件,从这几条简明的原理出发,可以推导出几乎所有的物理规律,给世界一个明确无误的解释,这就是第一性原理的威力所在。
“万物皆数”,宇宙遵循简单的数学规则,纯粹思维可以把握实在,这是从古至今伟大思想家们的共识。在十三世纪以前,中国古代技术成就曾遥遥领先于世界。从九章算术、齐民要术、鲁班锁结构和四大发明等成就看来,无不展示着中国先贤们机敏的心灵和非凡的智慧。但是为何最后中国没有产生科学?这就是著名的“李约瑟问题”,一度成为西方学者热议的话题。爱因斯坦就曾说过:“西方科学的发展基于两项重大成就:希腊哲学家发明了形式逻辑系统(在欧几里得几何中),以及发现通过系统实验(文艺复兴时期)发现因果关系的可能性。在我看来,中国古代圣贤没有采取这些步骤,这不会感到惊讶。但是令我本人大为惊讶的是,这些科学发现竟然完全是被他们做出来了,以及应用到社会中。他们到底是运用什么逻辑体系,我实在是搞不明白。”
笔者认为中国没有产生科学的最重要的一条原因是:没有追求第一性原理和底层逻辑的意识。中国古代的先贤没有超脱世俗之上追求永恒法则的热情,每当走到圣殿门前就戛然而止,未能一窥造化的辉煌,这是先贤们吃亏的地方。我们已经错过了太多的机会,而现在的机会已经所剩不多了。必须改变这种心理状态才能在基础领域有所突破,因为“只有有心人,才能看得清”。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-3-9 10:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社