fengzd的个人博客分享 http://blog.sciencenet.cn/u/fengzd

博文

AI可精准预测20年后人会得哪些病?????

已有 1301 次阅读 2025-9-19 12:04 |系统分类:观点评述

一位我很是敬重的科学网网友发文称:

AI可精准预测20年后人会得哪些病

科学网链接地址:https://blog.sciencenet.cn/blog-41174-1502470.html

一、博主说:

一款名为“德尔菲-2M”(Delphi-2M)的改良型大型语言模型,通过分析个人的医疗记录和生活方式,能评估出1000多种疾病的患病风险。博主接着说:一款基于英国40万人数据训练的人工智能系统,可估算一个人在20年内患上癌症及其他多种疾病的可能性。这款模型,利用健康记录和生活方式因素,能提前20年估算一个人患上癌症、皮肤病、免疫性疾病等疾病的可能性。尽管该模型仅基于英国的一个数据集训练,但这种“多疾病建模”能力未来或许能帮助临床医生识别高风险人群,从而尽早采取预防措施。相关研究已于今日发表在《自然》(Nature)杂志上(Learning the natural history of human disease with generative transformers)。

 二、原文陈述的“预测”步骤:

a. 基于ICD-10诊断、生活方式及健康填充令牌的健康轨迹示意图,每种信息均记录具体年龄。  

b. 训练、验证及测试数据来源:左侧为英国生物样本库,右侧为丹麦疾病登记数据库。  

c. Delphi模型架构。红色部分表示与基础GPT-2模型相比的修改内容。“N×”表示将Transformer模块按顺序应用N次。  

d. 模型输入(提示词)与输出(样本)示例,包含(年龄:令牌)对。  

e. Delphi的缩放定律:显示不同训练数据量下,最优验证损失随模型参数变化的函数关系。  

f. 消融实验结果:以基于年龄和性别的基线为参照,通过交叉熵差异(纵轴)衡量不同年龄(横轴)的模型表现。  

g. 事件发生时间预测的准确性:灰色圆点代表每次下一个令牌预测中,事件发生的实际时间(纵轴)与预期时间(横轴)。

三、AI能行的前提是:资料足够多并足够好

科学网链接地址:https://blog.sciencenet.cn/blog-1200905-1500798.html

不久前参加过一个“想用AI统筹所有已有的地球科学知识和资料,以便重新审视地球科学的已有理论的研究计划”的评估会议。我认为我闻出了两个漏洞(1)我国科学界对“地球科学知识和资料”的积累并不足够(这可以理解,毕竟我们花气力积累这类资料的时间较短吗);(2)绝大部分这类资料是西方科学界积累的(这也可以理解,毕竟他们开始积累这类资料的时间较长。特别是二战以后,他们花了很多时间和精力于如此的积累)。于是呢,我有了疑问万一西方国家关闭他们的资料网站和不分享他们的资料,我们“想用AI统筹所有已有的地球科学知识和资料,以便重新审视地球科学的已有理论的研究计划”就有难处啦。

四、我对“AI可精准预测20年后人会得哪些病”的批评

我觉得呀,合理的表述应该是:基于大量和可靠的资料,AI提出了可接受度较高的“20年后人会得哪些病”的预测。要不然呢,题目(AI可精准预测20年后人会得哪些病)会给人一种错觉:AI像我们想象中的神那样,会“无中生有地”预测未来。进而,这里的AI预测的是20年之后的事(还没有被检验呢),怎么会知道这个预测是“精准”呢?



https://wap.sciencenet.cn/blog-1200905-1502659.html

上一篇:《哈佛中国史》说
收藏 IP: 61.163.21.*| 热度|

5 刘进平 许培扬 郑永军 孙颉 王涛

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-9-22 02:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部