StochasticContr的个人博客分享 http://blog.sciencenet.cn/u/StochasticContr

博文

June 5 2023

已有 323 次阅读 2024-3-17 01:45 |系统分类:科研笔记

动态系统:  模型不确定性(假设某种uncertainty set) + 在线学习。

如何给 robust model with learning 这个合乎人做决策时思路的一个一般化的框架?

Predict + correct (a primal-dual framework).

​​单纯的 robust model 不考虑 learning. 

​单纯的 learning 在建模时强调的是参数的未知性,而不是模型的不确定性。

约束的引入,就自然引入了​duality.

​Occupation measure vs Pon Maximum principle 关系。

​另外,online convex optimization 与 输出调节的关系。

​输出反馈LQG:估计与控制器设计的分离。

​Multi arm bandit: UCB (​​一种Optimistic optimization)。

一般来说,​估计与控制器设计是不可以分开设计。郭雷当年做

随机自适应控制下最小二乘的收敛性的根本性困难。

​控制论与信息论的结合点:控制的反馈极限,总是跟这个被控系统

的不确定性有关系,这里的不确定性可以被信息论里的entropy 刻画。

Entropy 是一种隐藏的很深,但是又无处不在的一个量,这个量总是

刻画着可行与不可行的边界。

​人的有效思考总是借助某种框架,但是本质的创新又必须跳出这个

框架。这就注定了真正的创新无法来自于某种预设的模式。​创造性,

是来自于非理性,比如激情,和谐感,美感,神圣感。



https://wap.sciencenet.cn/blog-1213200-1425627.html

上一篇:Gradient as a dual
下一篇:May 17 2023
收藏 IP: 178.237.49.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 22:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部