姬扬的个人博客分享 http://blog.sciencenet.cn/u/jiyang1971

博文

深度搜索(DeepSeek)的数理能力

已有 2352 次阅读 2025-1-28 08:04 |个人分类:个人看法|系统分类:观点评述

我们已经见识了深度搜索(DeepSeek)的作文水平(从来写作要深思:DeepSeek作文演示二三例),接下来再看看他的数理能力。

我从大学普通物理课本里找了不需要画图的几道题(这些题有的是自己带图的,但是我只提交了文字版),DeepSeek的解题过程用截图显示(因为这部分内容很详细,或者说太啰嗦),我的说明和评论放在【】里。

 

1、一水桶绕自身的铅锤轴以角速度w旋转,当水与桶一起转动时,求水面的形状。

【杨维纮 编著,《力学与理论力学(上册)》,科学出版社,第61页,例3.4

【回答正确。原题的解答有图。】

 

2、如果一个盛有混合气体的容器由含大量小孔的疏松器壁构成,泄露的气体被抽入收集箱中。试分析箱内质量不同的组分浓度之比与漏气容器中原来浓度比的关系。

【赵凯华,罗蔚茵,新概念物理教程《热学》,高等教育出版社,第77页,例题5

【回答正确。】

 

3、质量为m、半径为R的匀质圆柱形定滑轮上跨一轻绳,绳的两端分别挂着质量为m1m2的物体,并知m2>m1。滑轮与轴间光滑无摩擦。绳与滑轮间无相对滑动。求滑轮的角加速度b、物体的加速度a和绳中张力。

【吴泽华,陈治中,黄正东 编著,《大学物理(上册)》,第152页,例3.6

【回答正确。原题的解答有图。】

 

4、土星质量为$5\times10^{26}$Kg,以相对于太阳的轨道速率9.6km/s运行,一个空间探测器质量为150kg,以相对于太阳10.4km/s的速率迎向土星飞行。由于土星的引力,探测器绕过土星沿和原来速度相反的方向离去,求它离开土星后的速度。

【杨维纮 编著,《力学与理论力学(上册)》,科学出版社,第102页,例5.6

【回答错误。可能是因为他没有理解“迎向土星飞行”的含义,所以不知道土星和空间探测器的运动方向相反。把土星速率前面加个负号,再重新交给他做,就得到了正确的结果。原题的解答有图。】

 

5、路旁观察者见一辆疾驰的车正鸣笛而过。已知声源的频率为1000Hz,车速是30m/s,空气中声速为340m/s。求该观察者听到的鸣声的频率。如果该车停着鸣笛。试问:当观察者以30m/s远离这个声源时,他所听到的鸣声的频率。假设其他条件不变。

【吴泽华,陈治中,黄正东 编著,《大学物理(上册)》,第344页,例6.8

【回答有误。2问答对了,但是第1问答错了。可能是因为他没有理解“正鸣笛而过”表示车子离开观察者越来越远,而不是越来越近。添加一句话“逐渐靠近观察者”或者“逐渐远离观察者”,再重新交给他做,就得到了正确的结果。但是第二天,我把这道题原封不动地交给他做,他就知道“鸣笛而过”表示车子离人越来越远,还专门做了说明,并给出了正确答案。不清楚他是怎么搞明白的。】

 

6、有一上升的气团,在气压为675毫米汞柱、温度为5摄氏度时达到饱和,在云底上方大约200米的地方,气压和温度分别达到659毫米汞柱和3.82摄氏度,求水蒸气摩尔分数的减少。

【赵凯华,罗蔚茵,新概念物理教程《热学》,高等教育出版社,153页,例题4

回答有些奇怪。首先,他采用的解题方式与书上不一样。在《热学》的正文里有大概两页纸的内容,讲述如何分析这样的物理过程,给出了相应的公式,所以在这个例题里,就直接套公式了。DeepSeek也是套公式,但是他选用的是某个经验公式,给出了类似的结果。而且奇怪的是,在第一次回答的时候,他把某个算术过程搞错了(很简单,只是算一个指数函数而已),所以给出了错误的结果。让他重新算,仍然给出错误的结果。让他用“深度思考(R1)”来算,他就算对了。然后再让他用普通思考来算,也算对了。有趣的是,在他显示的深度思考过程中可以看到,他对前几次的计算错误表示费解,猜测了多种可能出错的原因。但是我检验了一下,这些原因并不对,他可能也知道猜得不对,但是对这个错误很纠结。】

 

7、有一堆煤,第一次取走4/7,第二次取走5/7吨,请问哪次取走的多?

【这个问题是科学网博主张军平老师在微信群提到的,他还说,很多大语言模型都做不对这道题。】

结果很有趣。DeepSeek做错了,但是错的很有意思。

首先,这道题有个简单的答案,因为第一次取走了4/7,超过了一半,所以永远是第一次取走的多。

DeepSeek通过解方程,给出了一个临界值1.25吨,如果煤堆的初始重量大于这个临界值,第一次取走的多,如果小于临界值,第二次取走的多。也就是说,DeepSeek没有意识到,第一次取走的数量超过了一半,也没有意识到,如果煤堆的初始重量小于临界重量时,剩下的煤早就不到5/7吨了。

当我把DeepSeek的答案抄送到微信群里的时候,我也没认识到这一点,或者说,我跟DeepSeek犯了同样的错误。而且也不是我一个人,至少还有一位数学教授也没有看出来这个错误。所以说,这个错误有点儿意思。

当然,这是个很愚蠢的错误,理所当然地引起了嘲笑:大模型太傻了。

这道题有个隐含条件,但是Deep Seek没有认识到。

我重新问DeepSeek这个问题,他还是像以前一样回答。我再问一遍,答案还是一样。我跟他说,你做错了,重做,他还是给出相同的答案。如此两遍。

我选择“深度思考”,让他重新做题,结果是很长很长的思考,不是时间长,而是描述长,最终,他给出了正确答案。然后我让他放弃“深度思考”,重新问这个问题,他仍然给出了正确答案。

他能思考,能反思,能记忆,比我想象的厉害多了。

我重新问他一道题:有一堆煤,第一次取走14/27,第二次取走57吨,请问哪次取走的多?

他回答正确。

我又问他:有一群马,张三带走了13/25,李四带走了57匹,请问谁带走的多?

回答正确。

他能够举一反三,非常厉害。

可惜,没有一上来就用深度思考,不知道他掉到这个陷阱里是不是因为思考的不够,还是因为我的问题给他了提示,因为问了好几遍,说他有错。

在另一个微信群里,也有几个人试了这个问题。有一个人没用深度思考,得到的是错误的答案,另一个人直接用深度思考,得到的是正确答案。所以,有可能是因为思考得不够。】

 

总之,DeepSeek的作文水平很高,数理能力也很强。如果让他去参加今年的高考,我觉得考上清北也不是什么意外。

DeepSeek 文理兼修,既能写文章,也能解题目。上学期我教写作,下学期教大学物理和热学,可是看了DeepSeek 的表现,这些课还怎么上啊?

现在我很庆幸自己从2014年开始上网说话。在过去的十年里,把自己想说而又能说的大部分话,都在网上说了。以后你不管说什么还是写什么,大家都会认为是大模型说的写的。

未来已来。



https://wap.sciencenet.cn/blog-1319915-1470723.html

上一篇:从来写作要深思:DeepSeek作文演示二三例
下一篇:《十万个为什么》娱乐版
收藏 IP: 180.79.50.*| 热度|

8 武夷山 刘进平 宁利中 段德龙 王涛 郑永军 信忠保 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-27 16:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部