第一讲 什么是线性代数
这个学期要上一门线性代数课, 因此我就顺便把备课讲义写成公众号文章, 供大家参考.
这是线性代数第一讲, 我准备大致地讲一下什么是线性代数. 这是一种从数学物理角度理解的线性代数.
众所周知, 线性代数起源于求解线性方程组问题, 然后逐渐转变为关于向量和线性函数的研究. 线性代数研究的线性方程组都是有限多个变量的, 所以在代数学的范畴内. 对于线性偏微分方程(组)和积分方程的研究可以看作是具有无限多个变量的线性方程组, 它们是泛函分析和算子代数理论研究的内容, 属于分析学的范畴.
线性代数有两种形式, 一种是抽象的形式, 一种是具体的形式. 抽象形式有利于理解和直观的思考, 具体形式有利于计算和具体的求解. 抽象形式的理论中的主要概念是向量空间, 线性映射和双线性关系, 具体形式的理论主要内容是行变换, 列变换, 行列式的计算以及特征方程的求解. 抽象形式的理论侧重概念和结构, 而具体形式的理论则侧重流程和算法.
线性代数的研究对象可以和集合论的研究对象有很好的平行对应关系. 这种平行关系完全可以类比为物理学中经典世界和量子世界的平行关系. 我们知道量子世界和经典世界遵从非常不同的法则, 其中最重要, 最基本的法则就是所谓的态叠加原理, 这个原理可以说是一切量子奇异性的来源, 我们对它的哲学意义还很不了解. 我们接受它, 是因为它是目前我们解释量子实验最经济的假设. 不可思议的是, 这一原理性假设和线性代数是高度吻合的, 因此线性代数语言成为了描述量子力学最基本的数学语言.
在经典世界(集合世界)中, 我们用集合, 集合间的映射, 集合间的多元关系来表征一切, 而在量子世界(线性世界)中, 我们则要用向量空间, 向量空间之间的线性映射, 向量空间之间的多线性关系来表征一切. 经典世界的多变量映射, 如 w=f(x, y, z), 则对应成量子世界中的张量或者多线性映射. 集合世界中的二元关系和n元关系则对应成为线性世界中的二阶张量和n阶张量, 其中2值布尔代数则对应成实数域, 复数域, 或者其它的完备域. 特别的, 多项式则对应为平面或曲面上的定向图.
线性理论分为两个部分, 一个部分叫做线性代数, 一个部分叫做多线性代数. 前者主要研究线性映射和双线性关系, 后者则主要研究张量(多线性映射)或多线性关系. 从量子物理的角度来看, 线性代数对应于单体理论, 而多线性代数则对应于多体问题或者凝聚态问题.
前面说过, 线性代数有抽象和具体两个方面. 抽象和具体方面的联系是通过对各个涉及的线性空间取定一组基来联系起来的, 所有的抽象概念通过选定具体的基而得到具体的坐标表示. 比如向量的坐标表示就是一个数组, 向量空间的具体表示就是数组的集合, 线性映射的坐标表示就是矩阵, 双线性形式的坐标表示就是方阵, 多线性映射和多线性关系的坐标表示就是高阶张量. 因为不同基的选择, 使得各种概念的具体表示形式上有很多变化, 因此研究一个抽象概念如何随着基的变化而变化, 以及哪些性质和特征是和基的选择无关就是关于这个抽象概念的十分重要且基本的问题.
线性代数属于结构数学的一部分, 讨论的问题也是结构数学的问题. 最主要的有分类问题, 不变量问题, 和标准型问题. 向量空间的同构分类问题的完全解是维数理论, 维数是向量空间的完全不变量, 这是线性代数比较简单的原因. 线性映射的分类有好几种, 比如等价分类问题, 导致了矩阵的秩理论; 相似分类问题, 导致了有理标准型和若当标准型理论; 合同分类问题问题, 导致了二次型的惯性理论. 作为研究这些问题的方法, 矩阵的特征值和特征向量问题特别重要, 它也和很多实际问题有关.
我们对于线性方程组的学习是从初中就开始的, 但是主要侧重于简单的求解方法. 而对线性方程组的系统研究则是在线性代数中才得到彻底的发展, 并且形成了一个非常完备的理论. 对于线性方程组, 我们可以提出很多问题. 比如怎么样求解线性方程组,有没有一般的方法? 这个问题的答案是肯定的, 高斯消元法目前应该是一个最有效的普适方法. 什么时候一个线性方程组有解, 有多少解, 解空间的结构什么样, 这些问题在线性代数理论中已经有彻底而完美的答案. 不仅如此, 线性代数还讨论了当线性方程组的经典解不存在的时候, 我们应该如何处理它, 这是一个具有实际意义的问题, 即最小二乘问题. 在线性方程组的经典解不存在的时候, 我们应该考虑的是方程组的最小范数解, 它是某种意义上最理想的解. 这个问题和很多实际问题有关, 比如数据压缩技术, 主成分分析, 机器学习, 等. 在理论上则密切联系于矩阵的奇异值分解和矩阵的广义逆理论.
线性方程组可以为很多问题建模, 这也导致了其理解的多样性. 我们可以用三种普适的观点看待线性方程组.
第一种就是行向量的观点, 这是一种仿射几何的观点. 在解析几何中, 我们知道一个非退化的线性方程描述了一个高维欧式空间中的一个超平面, 因此一个线性方程组在几何上就是求解几个超平面相交的问题.
第二种是列向量的观点, 这是线性代数的观点. 它把线性方程组问题理解成一个向量如何用其它的一组向量线性表出的问题, 这是线性空间中的基本问题.
第三种是线性映射的观点或者矩阵的观点. 它把线性代数的系数矩阵理解为一个线性映射, 则线性方程组问题就是求常值向量的原象问题.
行向量观点其实是定义域空间的观点. 下面给出行向量观点的一个具体例子.
列向量观点其实是值域空间中的观点.
映射的观点或者矩阵的观点通过引入增广矩阵的概念, 把线性方程组的同解变形翻译成了增广矩阵的行变换.
高斯消元法的理论核心就是证明仅仅通过增广矩阵的行初等变换就总是可以把它变成一种标准的易解形式, 即简化行梯形矩阵. 高斯消元法是求解线性方程组的经典算法, 它在当代数学中有着重要的地位和价值, 是线性代数课程教学的重要组成部分. 除了用于线性方程组求解外, 它还可以用于行列式计算, 求矩阵的秩和逆,以及其他计算机和工程方面.
想看更多文章, 欢迎关注我的公众号: 数理同源
转载本文请联系原作者获取授权,同时请注明本文来自鲁学星科学网博客。
链接地址:https://wap.sciencenet.cn/blog-3582667-1499348.html?mobile=1
收藏