daizhancheng的个人博客分享 http://blog.sciencenet.cn/u/daizhancheng

博文

情系“矩阵的半张量积”

已有 22592 次阅读 2012-1-15 18:40 |个人分类:杂感|系统分类:科研笔记| 矩阵半张量积

作为一个年长资深的研究人员常遇到有青年学者或学生不知是出于敬老礼貌还是真心讨教会问我这样一类问题应该怎样选题怎样做研究每到此时总有点尴尬不禁想起李白的打油诗:“眼前有景道不得崔颢题诗在上头”。关于做学问、做研究许多名家大师都有过许多精辟见解像我这样充其量也只能算个猫辈”——如果比鼠辈略强的话——怎敢充当青年导师就拿同行前辈何毓琦先生来说吧他的博文内涵丰富、文笔流畅不说那直爽敢言的评述淋漓尽致的人生经历,句句都让人折服那本博文集是我的案头之牍时时翻阅也让学生人手一本学做学问学做人也学英语

 

自己既是猫辈当然无法与大狮相比但当了大半辈子的猫自以为也学了一点三脚猫的功夫所以也会技痒故不揣简陋也来现丑本想说一番做研究的大原则或大道理但实在腹中空空编不出个子丑寅卯来于是就想谈谈自己近十几年醉心的一项工作矩阵的半张量积介绍一下它研发的过程以及它的内容和应用无非是老王卖瓜但倘若对年青学子有点滴启发也算老猫对后生们提的问题的一个交待吧

 

大约在1998年前后在做非线性系统的控制设计时遇到大量多元函数与多元映射的计算问题如流形上各种李导数、分布的对合性以及流形上的张量场计算等当时有一些符号计算的软件可直接做非线性函数的运算但计算量大结果极其复杂难以应用通过台劳展开用多项式近似非线性映射成为一个顺理成章的想法一个齐次多项式很容易看成一个多线性映射而张量更是典型的多线性映射于是矛盾被聚焦到多线性映射的计算问题

 

众所周知矩阵是数值计算的最有力工具矩阵方法可以方便地应用于线性映射和双线性映射但它对三维或更高维数组却几乎无能为力能否用矩阵方法处理三线性甚至多线性问题呢这时调研成了一个不可逾越的必要步骤一番搜索果然有所收获原来早在八十年代初就有人提出了立体积的概念[1,2]它的想法很自然就是把三维数组摆成立方体随后我国学者对矩阵立体积做了许多工作[34]在其基础上进行了系统的总结和扩充[5]中有一个简明的综合介绍立体阵在统计中得到一些成功的应用但由于它需要引入许多新的运算规则使用起来不甚方便对于四维或更高维的数组运算立体积也无能为力了对此我国学者张应山提出了多边矩阵理论[6]这是一个创新性的工作但由于其计算过于复杂没有得到广泛推广

 

看来已有的工作不能满足我们的需要但有些想法还是很有启发的特别是[6]力图通过多边矩阵的方法对变量与其相应的系数进行配对这种想法是矩阵半张量积的出发点不管是立体积或多边矩阵它采用的都是矩阵普通乘法的一对一的办法这样高维数组就不得不排成立体或更高维的矩形体的形式要想把高维数组排成一个向量或一个矩阵就必须改变一对一的乘法规则,允一对多”。同时这种新的乘法还要能够自动地将系数与其相应的变量进行配对这就是我们后来找到的矩阵的半张量积[7]

 

Am×n矩阵Bp×q矩阵n=pAB满足等维数条件此时量积退化为普通矩阵乘积np的倍数或pn的倍数时AB满足倍维数条件多线性映射碰到的都是这种情况因此矩阵半张量积最初也是对倍维数情况定义的那么能否将矩阵半张量积推广到任意两个矩阵呢我们根据半张量积的一个性质将矩阵半张量积推广到任意两个矩阵

 

1998年清华大学卢强院士与中科院系统所联合申请国家自然科学交叉重点项目电力系统非线性鲁棒稳定控制代数化几何方法及工程应用其理论设想就是发展矩阵半张量积方法并用以实现非线性控制系统几何理论中常用的李导数、张量场等非线性计算该项目完成过程中矩阵半张量积的框架逐步形成但是将一个新的矩阵乘法推向世界是一个艰难的过程几乎没有人相信在矩阵乘法这样—个初等概念上会有意义的突破在多次向国外杂志投稿失败后我们转向国内并将基本概念结合应用问题推出第一篇关于矩阵半张量积的文章是结合非线性系统的Morgan问题数值解而提出的[8]

 

此后结合电力系统稳定域、非线性控制设计以及其他数学物理等问题矩阵半张量积理论与方法得到应用和发展这些工作主要发表于一些国际期刊上在这些工作的基础上我们出版了专著[7]它成为《现代数学基础丛书》中的一本关于它的一个简明综述在2007年世界华人数学家大会上45分钟报告[9]从提出矩阵半张量积到2006我们的基本工作都集中于半张量积在连续动态系统中的应用后来我本人的重点就转移了清华大学梅生伟教授率领一个团队一直坚持这方面的研究他们最近的一本专著[10]是矩阵半张量积在电力系统中应用的一个很好的总结

 

矩阵半张量积逐渐有了一定的影响但同时也在同行中引起了一些不同观点的争论争论之一矩阵半张量积的原创性它是否是新的它在定义上是那么简单明了在性质上是那样完美——与普通积无异在计算上是那么便捷易行而它的应用又是那样广泛普适那么为什么那么多前辈高手都没有发现它而直到今日才被我等猫辈发现

 

原因之一是半张量积的基本思想来自计算机例如C语言里多维数组不必排成高维立体的形式C语言通过指针、指针的指针、指针的指针的指针……来寻找数据的不同层次其实半张量积的自动寻配也就是依靠规则去自动寻找相应的指针或曰数据层次原因之二半张量的真正应用离不开计算机如果靠纸和笔甚至造一个有意义的例子都很困难也许这使得半张量积只能在计算机时代出现

 

争论之二半张量积的科学含量有些人认为半张量积太简单了把矩阵乘法推广到任意两矩阵是一件容易的事还听几位老先生说华罗庚先生当初就给了一个推广考虑A×B如果A的列数小就补上若干零元素列如果B的行数小就补上几个零元素行使得最后A的列数与B的行数相等这当然是一种推广而且大概是最简单的推广我们在最近的一篇文章里首次披露了我们在研究过程中考虑过的几种推广[11]这也说明了给出一种推广并不难难的是它要不改变原来矩阵乘法的性质同时它要有用当然我们也许是运气找到了这么一个而且很可能还会有其他有用的推广再说简单老子说过:“大道至简”。记得哈代也说过没有找到相关参考):“数学上只有简单的结果才有意义。”

 

有点跑题了还是书归正传回到半张量积的研发历史吧2006年我到瑞典访问初冬的斯特哥尔摩真是够受的早晨10点天才开始蒙蒙亮到了下午3街道就全靠路灯照明了夹杂着雨点夜以继日地下个不停铲雪车和撒盐都赶不上积雪的速度到处是泥泞那是一个周日的早晨我懒懒地起了床吃了两片面包和一杯牛奶我呆呆地望着窗外外面仿佛是一个无人仙境未被踩踏的白雪覆盖着大道房屋和树木只有晨曦中的飞雪给这个银白的世界些许生气

 

百无聊赖之际忽然想起昨天在旧书店花50克郎买的一本数学手册[12]赶紧找出来把玩鲁迅先生所言不差:“无聊才读书”。书的第一章是离散数学第一节是逻辑我虽未学过逻辑但当年在美国教过本科生的Contemporary Mathematics当代数学),接触过一点为了复习一下自己那半吊子的逻辑知识我拿出纸笔试图证它几个简单公式几个等式算过头脑里忽然闪过一个念头这不是可以用半张量积算吗

 

我把向量(10)对应”,(01)对应”,于是每个逻辑表达式都可以用一个矩阵半张量积来表示了强压着兴奋的心情我又用此证了几个逻辑等式终于相信这是对的了

 

我把那本数学手册放在嘴边亲吻了一口就跑去开冰箱找啤酒了如果预知以后事情的发展我想5000克郎买那本手册也值[11]中有一章是关于逻辑的半张量表示这个工作的初衷是一种纯数学的兴趣是那本手册和斯特科尔摩冰雪的功劳我当时曾试图将其应用于模糊控制但不过是写了两篇文章并不是很成功其实当时对模糊控制很不了解

 

常常听到这样一句话:“机会总是留给有准备的人。”相信我这句话是真理我很幸运遇上了这样的机会2008年初新年刚过我在香港第三次中瑞双边控制会议上听到清华大学赵千川教授关于布尔网络的报告他说到就是两阶的布尔网络动态系统要想给出不动点和极限圈的一般公式表示也很困难布尔网络动态系统是一个逻辑动态过程对于逻辑过程人们掌握的工具很少我的脑子忽然像过了电一样如果用半张量积把它表示成矩阵形式那不就可以用代数的方法来解决它了吗

 

那天晚上我把赵教授请到我的住处我说我不懂布尔网络你现在是我老师我把我听你报告的理解跟你讲你帮我把关看讲得对的对我们讨论到很晚我真弄懂了他临走我对他说我或许能找到N维网络的一般公式赵教授年轻有为他是我学习布尔网络的第一位老师

 

从这次会议回来之后我苦苦思索一个问题一个逻辑动态方程可以转化为矩阵形式N个方程怎么合到一起呢最后终于想出了一个方法把它们乘起来这样一个逻辑动态方程就变成了一个差分方程传统的矩阵分析方法就可以用上去了这个发现为布尔网络的研究找到了一个便利的工具

 

2008年春节我从大年三十一直干到春节过完大门都没出我一口气写了三篇长文:Analysis and control of Boolean networks:Part 1. Topological structure of Boolean networks; Part 2. Input-state structure of Boolean networks; Part 3. Controllability and observability of Boolean control notworks这三篇文章投到IEEE TAC很快就被拒了但主编Cassandras明显表示这里可能有非常有价值的东西他甚至同意我们改成Part 1-Part 2再投TAC发长文是很难的事为争取尽早让我们的成果面世后来将Part 1IEEE TACPart 2IEEE TNNPart 3Automatica它们先后均以长文Regular Paper形式发表了TAC的最慢晚了一年这说明分开投的决策对了

 

此后布尔网络控制的半张量积方法在状态空间描述各种子空间的定义与计算布尔控制系统的状态转移阵优化控制等取得一系列突破逐渐形成了一套较完整的理论体系我们在Springer发表了470页的专著[13]可以自豪地说该书中所有结果都是我们自己的

 

其实半张量积还可以用到许多其他有限值映射问题中如动态博弈、模糊控制、编码、线路设计、有限自动机等等我们即将出版的另一本专著对这些问题做了详细介绍[14]最近应《科学通报》主编夏建白院士邀请我们写了一个关于矩阵半张量积的特邀评述[15]交稿后夏主编又特别邀请郭雷院士写了一个点评[16]

 

最近我们的相关论文Controllability and Observability of Boolean Networks获得国际自动联合会(IFAC)颁发的Automatica2008-2010最佳理论/方法论论文奖”。“AutomaticaIFAC主办的国际控制领域的顶级刊物之一IFAC1981年开始,每3年评一次,每次评最佳理论/方法论论文最佳综述论文最佳应用论文各一篇当选论文作者包括:B.D.OAnderson(澳大利亚前科学院院长,澳两院院士),K.JÅström(瑞典两院院士),LLjung2次,瑞典两院院士),A.SMorse(美国工程院院士),AIsidori2次,IFAC前主席),HKimura2次,IFAC最高奖Quazza Medal获得者),还有JCWillemsMVidyasagarC.IByrnesMSpong等控制领域著名教授我们的上述论文是由华人作者完成的第一篇获该奖的文章

 

矩阵的半张量积是我国学者的原创性工作,它正在受到国内、外学者越来越多的重视现在,已经有一批由其他国内外学者完成的以半张量积为工具的后续工作出现在IEEE TACAutomaticaIEEE TNN等一些最好的国际控制杂志上研究内容涉及动力系统、网络、线路设计与检测等矩阵半张量积可望成为计算机时代一个重要的数学工具

 

假如你看了这个关于半张量积的故事有所触动感到它确实说了点什么那这篇文章就没白写最后用自己的一首诗来结束本文

 

My Baby

 

(写给我的Semi-tensor Product)

 

你是我的心

因为

我用我的心

饲你

你是我的魂

因为

我用我的魂

塑你

多少个夜半深更

我辗转未眠

想你

多少个风和丽日

我孑然面屏

书你

我赞美你的容颜

简洁

我惊叹你的身手

犀利

我感谢上帝

让我遇到了你

愿我离去的一天

无愧今生

我的 Baby

你将在人世间

长存

 

参考文献:

[1] Bates D M, Watts D G. Relative curvature measure of nonlinearity. J R Statist Soc B, 1980, 42: 1-25

[2] Bates D M, Watts D G. Parameter transformations for improved approximate confidence regions in nonlinear least squares. Ann Statist, 1981, 9:1152-1167

[3] Tsai C L. Contributions to the Design and Analysis of Nonlinear Models. Doctor Dissertation. Minneapolis: Univ of Minnesota, 1983.

[4] 韦博成非线性回归模型LS估计量的二阶矩高校应用数学学报, 1986, 1: 279-285.

[5] 王新洲非线性模型参数估计——理论与应用武汉武汉大学出版社, 2002.

[6] 张应山多边矩阵理论河南中国统计出版社, 1993.

[7] 程代展, 齐洪胜矩阵的半张量积——理论与应用北京科学出版社, 2007 (第二版, 2011).

[8] Cheng D. Semi-tensor product of matrices and its application to Morgan's problem. Science in China, Series F, 2001, 44(3): 195-212.

[9] Cheng D. Semi-tensor product of matrices and its applications: A survey. In: Proceedings of ICCM 2007, Hangzhou, 2007: 641-668.

[10] 梅生伟刘锋薛安成电力系统暂态分析中的半张量积方法北京清华大学出版社, 2010.

[11] 程代展齐洪胜. 矩阵半张量积的基本原理和适用领域系统科学与数学. (to appear)

[12] L. Rade, B. Westergren. Mathematics Handbook for Science and Engineering, Studentlitteratur, Sweden, 1989.

[13] Cheng D, Qi H, Li Z. Analysis and Control of Boolean Networks: A Semi-tensor Product Approach. London: Springer, 2011.

[14] Cheng D, Qi H, Zhao Y. An Introduction to Semi-tensor Product and Its Applications, World Scientific, 2012. (to appear)

[15] 程代展赵寅. 矩阵的半张量积一个便捷的新工具科学通报, 56(32): 2664-2674, 2011. 

[16] 郭雷. 评矩阵的半张量积一个便捷的新工具科学通报, 56(32): 2662-2673, 2011. 

[17] Cheng D, Qi H. Controllability and observability of Boolean networks, Automatica, 45: 1659-1667, 2009.



https://wap.sciencenet.cn/blog-660333-529186.html

上一篇:我当选IFAC Council Member的前前后后
下一篇:答Fuchenglong先生
收藏 IP: 159.226.25.*| 热度|

21 黄富强 徐耀 谢鑫 刘全慧 于春水 陈安 陈儒军 李宇斌 丁大勇 朱志敏 张能立 张士伟 徐晓 杜玉亮 李晓瑜 crossludo zhangcz07 Magnolia xqhuang yewen ericLJ

该博文允许注册用户评论 请点击登录 评论 (18 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-10-31 09:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部