控制类收藏夹分享 http://blog.sciencenet.cn/u/lugh56

博文

这几年关于控制理论的一些记录

已有 133 次阅读 2025-11-18 18:49 |系统分类:科研笔记

时间过得真快,组织或者参与知乎网上的年度控制理论收获系列问题(https://www.zhihu.com/question/1926678870440022988/)已经到了第7年,除了第一年没有写回答之外,剩下每一年都写出了或长或短的回答。刚才翻看的时候,突然想到这么一个问题,五六年时间,说长不长,说短不短。中间的思想观点到底演化了多少呢?有没有之前坚信的观点已经被抛弃,有没有之前认为错误的观点已经被修正了?

将时间轴拨回第一年举办的时候,那个时候没有什么具身智能,没有什么这那这,至少对于公众生活或者大多数研究者的世界里面没有这个字。我不否认有些前沿性的研究工作已经在做。但属于是静默期。那个时候大家控制理论讨论激烈的是什么呢?就是理论与实践的差距

一方面,我们的理论已经积累的够多,看各种控制理论地图就可以知道很多概念层出不穷。有可能学会其中两三个就已经耗费了大量的心力。而当一个人走出校园,拿着积累的控制理论知识去找工作的时候,会陷入困惑,就是为什么这些方法没有投入应用呢?

如果说你说数学有些东西是为了人类的好奇心产生的,那自然暂时没有什么运用,大家也可以理解。但我们,每次学习控制理论的时候,每一个分支都在强调自己是解决工程问题而来。嗯?我们在工程界为什么没看到这些问题呢?或者说没有任何的面试官会在里面问,说你这个高级控制器具体设计步骤呢,他只会问你硬件,问你软件。问你计算机甚至会问你的学生社团经历,他都不会问你这个控制器怎么设计。

那个时候,思想非常的朴实。不会去思考什么控制理论是否要被废弃掉,不会去思考到底是数据驱动方法还是模型驱动方法的优劣。大家思考的主要问题就是,你这个理论呼呼呼呼,这么的一大堆。 为什么实践当中似乎并不太需要?一开始的着眼点在于是不是这个模型建的不对呀?是不是我们的理论里面模型太复杂了,或者说生搬硬套的一些因素?导致没法直接用到工业现场。还是说我们只关注了设计过程,而没有特别关注模型建立。导致我们“深入宝山而空回,提着刀不知道要砍谁”,(emmm稍微文雅一些,叫拔剑四顾心茫然),或者是不是因为这个控制理论论文数学复杂度比较高?大家都看不懂啊。所以在最早期的回答里面,提出的第一个观点就是控制学家要和工程现场人士多交流,多见面,先把需求对清楚。而我们控制专业的学生要立志去当好 翻译 家。

当然口说无凭,嘴上喊口号谁都会。我们就拿着这个原则进行了工作。首先开始收集论文。任何一个出入控制理论研究的研究者都会被他所选择的哪怕非常冷门的主题的论文数量所震惊。洋洋洒洒,成千上万。制定一个课题,开始做吧。经过一段时间的打基础和阅读文章,就会开始思考自己要说什么。指望几个月的阅读去提出一个新的思想,那是不大可能。绝大部分的研究者第一篇练手作是模仿着之前的文章怎么去改进之前之前的文章的思路。然后碰到的第一个问题是生搬硬套。无论是看论文还是自己写论文都会碰到,就是别人的方法拿过来直接用。别人做这个场景,你来做这个场景,这会导致有可能在别人文章当中适用的方法。在你的文章当中不适用。这里的不适用,不一定说证明,因为证明至少仔细检查能看出来。而是说大部分时候没有发挥出这个系统本身的特色。理论上都不完备,怎么敢奢求人家去应用呢?

行再往后呢,我们可以说、我们注重这个系统的特色,对研究的方法进行了一些改变。这当然没有什么问题,至少你得到的是一个新结果,好不好咱们另外再说。我们先来讨论另外一种情况。就是这个问题,是这个系统的特色问题,控制领域前人的方法没有做过。很多做过这个问题的,又不是属于我们口中的控制理论。有可能说啊,这个问题在计算机学界,在统计学界做的比较好。但是呢?我们新入行的学生就会说这个不是我们学科内容,我不做。这还算头脑比较清醒的,头脑不清醒的就会说这个问题,我觉得控制的能做,然后推了大半年时间,发现控制理论不是解决这个问题来的,至少不是直接解决这个问题。中间但凡有人劝他说你用其他方法,他说我是控制学科的人,我就要用控制理论。当然这种思想的起源呢,大家也都能理解。因为一个课题组没有基础的方法,你去自己学。不如直接继承师兄的师姐的,一步一步的改下来,那样爽快的多。所以当时这里也是稍微提了提,然后呢让有能力的同行们去积极探索,不要让我们整个学科固步自封

当然从目前的发展趋势来看,时代的发展,技术的进步经济需求的发展已经让这个目的达到了。这个我们按下不表,后面再说。接着回到上面。获得了一个新结果,对于研究生青年学者或者说说的广泛一些,对于任何一个学者都是相当激动的事情。但我们接着往下做的时候,就不得不反思这样一个问题,就是我这个新结果到底好不好呢?当然了,有些科研的思路可能就是说打一枪换一个地方,这个组合做完我做下一个我做另外一个,我从来不考虑说在这篇文章上我改进什么东西,即使说改进,我也是往上面加buff。这种大家都司空见惯,没有什么反对。但是总归有一天,大家会到反思自己结果好不好的阶段。新结果和好结果,这是两个问题。一个新杯子,它可以五花八门的设计。他只要跟前人不一样,哎,他就是个新杯子,但是好杯子呢?你要去试试了,说这个接水怎么样啊?拿着方不方便呀?便不便于携带呀。这就要求大家亲身实地或者认认真真的把自己结果的使用流程完整的过一遍。当你发现要推进一步的时候,你就需要算几十个上百个方程的时候,你就应该知道这个结果至少暂时不会被工程采用。当然这里只是举个例子,是有可能没有办法的时候也是可以的。可以看到所谓对前人结果的实质性改进,无论是它的计算量。它的复杂程度,它的允许范围大多并不是来自于理论的空想,而来自于对于前人结果一步步的自己计算。没有自己计算这个过程,就不可能有对弊端的发现。因为你看定理都差不多嘛。

除了以上我们说的这种算是主流的研究方式,我们有时候呢还会在看文献的时候发现两种。一种呢是这个方法我都没听说过,但是作者就是来用了,效果很好。一种是,嗯?人家都在关注稳定性问题,他怎么在关心什么鲁棒性能控性的?但是你要说吧,他也是控制理论,这倒没问题。

对于前一种来说,如果你是研究该课题的一个学者,你往往会发出了感叹,我怎么不知道有这种方式!这就属于是数学或者其他学科的知识面的问题。

第二种呢则更加考察对理论的把握能力。比方说大家都在做稳定性,你在做稳定性。用现在流行的词,你卷不过人家。哎,你看看我做个什么鲁棒,我做个什么能观性?我看看有没有可能工作结果少,不那么卷?

深入一些,就是对前人结果多问几个为什么?我们一般的思路是顺着前人结果来到最后一步,哎这个地方可能计算有点复杂,我想我要去改进改进。哎这地方考虑可能有点不足,我去思索思索。但是很少有人去关注。第一步假设是真的需要吗?我们这里为了说明清楚,举一个例子。在多智能体系统控制当中有一个词叫二分一致性。同行都知道。只要结合结构平衡假设,搭配上适当的控制协议设计,它就能实现二分一致。对于一般的标量权重网络来说,这个结论没有什么问题。所以说大家就开始干了,你考虑这个,我考虑那个,现在基本上一一搜这个关键词差不多几千上万篇。但权重方式发生改变的时候,早期文章也是这么干的。只不过我把那个权重给他改一改,那个条件给他带入进去,规定好结构平衡,然后接着二分一致,这样没问题。正当大家如火如荼的往前冲刺的时候,有几个作者发现了哎,怎么这个网络改完权重之后,他不符合这个结构平衡的定义,它仍然能二分一致呢?一开始大家觉得是定义错了,然后反复的回到原先的文章里面看,说没错呀,就是这个定义呀。核心思想都一样的。许多人呢,就放下了疑虑。说这有可能只是一个特例。直到后来有一个作者在这方面提出了一个新的结构特性。

如果以上这些都做到了,一个新结果。又是一个好结果,而且又不是那么随大溜的结果。似乎没有什么问题了,来,让我们冲进工程现场。此时是2023年底,我以为我找到了答案:

我们要追求那些既新又好的结果,我们要抓住系统的特色,我们要接纳其他学科的方法。我们要善于挑战自己领域的常识,我们要善于反思自己。这5个怎么看怎么有理。

钟声敲响了,同学们,欢迎来到2024年。

2024年最令我印象深刻的是,使用者说一句话,机器人或者机械臂就能完成他的目的。有人说这有什么印象深刻的?只不过就是多了个话语转化而已。我们以前做这个图像识别分拣的时候不也是通过摄像机看到,然后把它给挪到一边去嘛。或者说之前没有分拣的时候,电脑上一点让机械臂去拿不也差不多嘛。来,我们仔细看一看。无论是图像识别分拣还是电脑去点?是不是都已经分类完了?某件东西应该放在哪里 已经写进了机械臂的内部逻辑。所以大家市面上的比拼都是在于你2分钟拿过来,我1分钟拿过来,你1分钟拿过来,我半分钟拿过来。

而加入人这一因素的时候,问题就忽然之间回到了十几年前那种场景。那个时候大家拼的不是说谁分拣的快。大家拼的是谁能分类的多?谁往里面写的规则多。你这个只能识别干垃圾和湿垃圾,哎,我这个就不一样,我能识别水果了,蔬菜了,包装了,塑料了,塑料还能分为降解的和不可降解的。那我就比你厉害。什么?你说你分拣的快,但我分出来的多啊。当然这并不是历史的倒退,我们看一些新情况,首先最主要的问题是人类语言的模糊性。你给我拿个苹果来。机器人的大脑开始疯狂运转:

主人在这儿,苹果是什么?搜一下嗯,哦,苹果这是这个样子,解锁一下。苹果有可能在1楼。水果区那里放着。我得先到1楼去搜索。找到了,大概是这个,让我来确认一下这个是不是苹果。嗯,看上去没有什么问题。给主人拿过去吧。上到2楼。嗯,主人在哪来着?啊?另外一个房间,定位住。然后给他靠近。看看主人怎么拿合适,把这个苹果给他递过去。

如果把它拆解成一个一个一个小问题,用不同的技术给它解决掉。也不是不行,但就是一个是费时间,一个是费精力。大语言模型这种东西出来之后呢就相当于给了他一个集成,他学习到了人类的基础知识库,然后呢他自动进行任务分解,然后一个个的做,最后集成。大模型似乎提供了一种全包的途径,但是如果我的场景没有那么复杂的话,我们的控制还是很有意义的嘛。难道你大模型能够在最优控制上跟我一较高下吗?我不相信数学上找到的最优控制你能超过他。

不得不说,这种观点呢,是中性的。是把问题暂时搁置的。就像我们之前对待数据驱动和模型驱动一样,承认你的研究价值。但是呢,我认为有些时候我们能获得模型的,所以说仍然坚持用基于模型控制方法。

但是这个观点是非常脆弱的。因为这个道理很浅显呀,我这么复杂的任务我都能做,我为什么不能把我的整个东西全部做进去?我把你那些简单的场景全部给你解决掉。我一个人全包了,你们,out。什么?你说你们的方法,数学难度高,我能学会,不好意思。我直接用最优控制,我也不跟你说什么比拼性能,你最优,我也最优。

这叫什么呢?这叫逃无可逃,避无可避,只能从头学习具身智能。了解这个强悍的事物。而且最近这一两年一看新闻,嗯,原来大家都在这样干呀。一开什么学术会议,大家一说就转到具身智能去了,转到机器人去了。开始搞强化学习了,开始搞大模型了。当然这里面具体的细节就不展开了,因为前两天刚发了一个回答。就避免重复。这里只挑重点说

如果说上面的5个我们要,是纯粹的反思自身的话,那么剩下的就变成了开眼看世界。我们能做到精良的机械臂,我们能让火箭上天。我们能让两个卫星在这么远的距离下精确的对接上。但是我们的机器人走进生活了吗?除了扫地机器人之外,都没有。现在大众的需求是什么呢?是功能越来越多。你10个功能,我这个机器人功能无上限。你不用光考虑他说的速度有多快,不用考虑他那个收敛性能有多好。我卖的就是比你好

有人说这怎么打,这不是明摆着嘛?全部已经game over,大家都举起具身智能的大旗得了,这个盛宴已过,理论已成。一个字,润。

但此时呢产生了两个问题,这两个问题为控制理论寻得了一线生机。一种出路。

第一个,我的机器人10个功能虽然少,10个功能完美运行。你这每一个功能都能实现吗?要不请你们证明给我看?这可不像你们推荐系统,推错了,我划掉,这可是要命的东西呀。一个安全保证是控制理论目前能发挥价值的地方。而且正如前面回答所说,技术越发展,一方面策略会越来越精细,另一方面发现这个弊端的速度越来越快。往常可能运行个十几年,二十几年才会发现的偶然情况。今天在模拟当中就可以完全复现啊。

有人说了,我承认我们现在呢还需要一些规则保底。但是这也不是你们学科不死的理由呀。小同学,你们学科光控制理论做出了100多种理论,我随便找几个用用不就行了吗?我承认你们的价值,但是你们有必要继续去研究吗?我只要敞开胸怀,把你们接进来。完事儿。那么你,尊敬的同学,你来告诉我现在哪里还需要你单独去搞控制理论研究。还能提出什么新的理论吗?

那就到了第二个。亲爱的朋友们,在人类没有发明机器人之前,谁处理这种场景最舒服呀?当然是生物本身,生物本身是我们应该注重的方向了。或者说是我们早就已经开始注视并且重视的方向了。从神经网络拟合系统动力学、控制、李亚普诺夫函数。到运用机器学习、获得控制律、构造白盒李雅普诺夫函数,模仿生物。模仿我们还不知道的生物机理,个体的,群体的,当然从本人的背景来看的话,可能对于群体关注的更多。

一件新事物的来到带来的是恐慌。但在互相交流当中往往会发现,他并不是敌对的对手。也不是啥都不懂,放下自己的偏见,放下自己的敌意,坚持自己的核心,坚定自己的目标,看看自己能做什么?看看自己想做什么?让我们期待,明年的一年有新的认识,新的发现。新的感受,新的提高,新的进步。



https://wap.sciencenet.cn/blog-3387802-1510762.html

上一篇:控制已死?——从机器学习到群体智慧
下一篇:在敖德萨寻访李雅普诺夫
收藏 IP: 221.221.237.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-11-18 23:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部