明皓亮
明皓亮研一下第九周周报
2025-4-27 11:09
阅读:238

本周完成工作:

1.复习优化方法考试

2.化工项目里对现在训练好的模型生成的几万条PDL生成对应的PID图,大约有93%的PDL可以成功生成对应的图。

3.看了一下项目里有助于写子刊的三篇论文

(Nature正刊) Autonomous chemical research with large language models

Learning from flowsheets: A generative transformer model for autocompletion of flowsheets

Intelligent Process Flowsheet Synthesis and Design using Extended SFILES Representation

本周问题汇报:

1.Autonomous chemical research with large language models

这篇论文就是设计了一个智能体,设计的这个智能体主要有五个模块,分工还挺清晰的。首先是计划模块,负责接收我们输入的问题,然后根据情况去调动其他模块。

接下来是搜索模块,它会把 计划模块给的查询转换成 Google Search API 的请求,跑去网络上找资料,然后从搜索结果里扒出有用的信息。

和它配合的是本地文档检索模块,专门从本地的 API 文档里提取细节,保证后续操作不会走偏。

然后就是代码模块,它把需要算的东西(比如算试剂用量、做数学运算)扔到一个隔离的 Docker 容器里跑 Python 代码。要是出错,GPT-4 还能看错误提示去修改脚本,几乎实现了全自动调试。

最后一个是实验执行模块,把 Planner 生成的实验协议发给自动化硬件或者云实验室,实际去操作实验设备;如果那边还没自动化,就把步骤给人来做。

他们没有搞大规模 benchmark,而是用几个“从头到尾跑通”的典型流程案例(比如 PDL → 画图 → 仿真 → 反馈优化)来做系统验证。论文的目的更多是做概念验证,展示一个基于大语言模型的科研智能体,怎么跨模块协同完成化学研究任务——查文献、写代码、操设备、拿数据、再推理优化。

所以咱们这能不能也用几个“从头到尾跑通”的典型流程案例(PDL → 画图 → 仿真 → 反馈优化)来证明系统的能力,再用个别统计指标(如 parse 成功率、专家打分一致性)来加强说服力。

比如说可以有以下指标:

语法准确

图像和真实标记图像有没有什么相似度指标

转化为graph和真实标记的图来算拓扑准确?图编辑距离或节点匹配率(单元操作个数与类型)边匹配率(流向、分支、回路连接)

专家(人类和GPT)打分

仿真一些流程,看是否能生成对应产物并满足一些基本条件

进行小规模台架试验,在台架上基本能运行且操作安全,就说明自动生成的流程在实践中有直接应用潜力。

2.Learning from flowsheets: A generative transformer model for autocompletion of flowsheets

任务是sfiles2.0补全,用仅解码器Transformer。

用来成为流程模拟软件的标准辅助功能,实现流程图结构和操作点的自动推荐

用假数据进行预训练,真数据进行微调。

假数据是通过先把整个流程分成不同的部分比如初始化:添加原料流(可能包含前处理步骤)、反应子过程:添加反应器等单元,并可进行热集成(热交换)、热分离:加入蒸馏塔、整馏塔等热分离单元等,在每一部分都按照设定好的概率来随机选择这部分的元器件最终生成整个流程。

它采用两种解码策略,束搜索倾向于生成较高概率且常见的流程结构,保证了生成序列的正确性和可靠性。而 Top-p 采样引入随机性,能够探索更罕见或创造性的结构,但也容易产生不符合语法的输出。

3.Intelligent Process Flowsheet Synthesis and Design using Extended SFILES Representation

设计了一个eSFILES。就是把设备和管道的参数加上了。还有个什么分层的没看懂图片太模糊了。没什么参考价值。

转载本文请联系原作者获取授权,同时请注明本文来自明皓亮科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3622926-1483609.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?