博文

June 5 2023

已有 323 次阅读 2024-3-17 01:45 |系统分类:科研笔记

动态系统: 模型不确定性(假设某种uncertainty set) + 在线学习。

如何给 robust model with learning 这个合乎人做决策时思路的一个一般化的框架？

Predict + correct (a primal-dual framework).

单纯的 robust model 不考虑 learning.

单纯的 learning 在建模时强调的是参数的未知性，而不是模型的不确定性。

约束的引入，就自然引入了duality.

Occupation measure vs Pon Maximum principle 关系。

另外，online convex optimization 与输出调节的关系。

输出反馈LQG：估计与控制器设计的分离。

Multi arm bandit: UCB (一种Optimistic optimization)。

一般来说，估计与控制器设计是不可以分开设计。郭雷当年做

随机自适应控制下最小二乘的收敛性的根本性困难。

控制论与信息论的结合点：控制的反馈极限，总是跟这个被控系统

的不确定性有关系，这里的不确定性可以被信息论里的entropy 刻画。

Entropy 是一种隐藏的很深，但是又无处不在的一个量，这个量总是

刻画着可行与不可行的边界。

人的有效思考总是借助某种框架，但是本质的创新又必须跳出这个

框架。这就注定了真正的创新无法来自于某种预设的模式。创造性，

是来自于非理性，比如激情，和谐感，美感，神圣感。

转载本文请联系原作者获取授权，同时请注明本文来自魏波科学网博客。
链接地址：https://wap.sciencenet.cn/blog-1213200-1425627.html

上一篇：Gradient as a dual
下一篇：May 17 2023

收藏 IP: 178.237.49.*| 热度|

数据加载中...

返回顶部

扫一扫，分享此博文