探索未知分享 http://blog.sciencenet.cn/u/gzchengzhi 社会热力学、相对论和宇宙学、暗物质、地外文明

博文

DeepSeek何以让英伟达暴跌

已有 3349 次阅读 2025-1-28 09:57 |个人分类:儒学与现代化|系统分类:海外观察

昨天晚上美股开市不久,世界第一市值的英伟达股票就暴跌了12%,到了收市的时候跌幅已经达到17%。从各方面的报道来看,英伟达暴跌的原因在于中国的一家AI公司DeepSeek采用了一种非常经济简单的方法来实现大模型,这让投资者担忧今后人工智能对于高端芯片的需求会大幅下降,从而影响英伟达等公司的芯片销售。实际上不止英伟达股票下跌,包括博通等等这些芯片制造公司的股票都录的一成以上的跌幅。这一跌幅也扩大到了一些电力公司,导致整个美国股市的市值下跌了1万多亿美元。

那么为什么一家以前毫无知名度的初创公司的一个大模型能够对世界知名的芯片公司产生如此大的影响?这其中的原因在于这几年人工智能技术的快速发展导致对高速运行的大规模集成电路的需求产生了极大的影响。人工神经网络严重依赖图形处理芯片的高速运行能力,这使得像英伟达这样的显示器芯片制造厂商出货量快速增加,进而导致其业绩也高速增长。而人工智能大模型的大量运行又导致电力需求急增。这就形成了一个一荣俱荣,一损俱损的局面。

大模型运行耗电巨大的原因跟信息处理需要消耗大量的能量有关系。在热力学当中有一个熵的概念,就是说按照自然规律,熵是不断增长的。如果要让熵减少,就需要不断向系统输入能量。按照香农的信息理论,信息就是熵。处理信息就是一个不断减少熵的过程。现代信息社会中,这一信息处理过程的能量消耗是非常巨大的。但这并不意味着消耗大量能量去处理信息划不来。按照我们人体的能量消耗比例来看,一个人75%的能量都会消耗在大脑上面。这就是说一个人平时吸收的大部分能量实际上都是用来处理信息进行思考的。

目前来看,我们现在的大模型以及加密货币处理所消耗的能量占人类在地球上消耗的总能量的比例并算太高。也许今后就像人体一样,这种大模型信息处理所消耗的能量要占到人类在地球上消耗能量的75%左右才比较合适。由此可见,即使按现在的技术来发展人工智能大模型,全世界的能源供应也还是足够的。

然而DeepSeek这样简单的大模型的出现,有效改变了这一状况。DeepSeek大模型最直接的影响就是导致对芯片性能的要求大幅度降低。像Open AI的训练成本达到几个亿美元,而DeepSeek大模型的训练则只需要几百万美元,二者相差几十倍。说明现在运行人工智能的大模型不再需要很高端的英伟达图形芯片,只需要使用那些非常成熟制成的图形显示芯片就可以了。这也可能就是英伟达等芯片公司股价大幅下跌的原因所在。

DeepSeek大模型对人工智能的影响更主要的还是反映出了现在的人工神经网络技术还有非常大的改进的空间。现有的人工神经网络主要采用的深度学习卷积神经网络。这种神经网络最初是用来模拟人的视觉神经系统的,因此它最早在模式识别方面得到广泛的应用。但是我们也知道人的视觉神经网络系统跟大脑神经网络系统相比还是有比较大的区别的。按照现有的生理心理学的知识来看,人的大脑神经网络系统结构上要比人的视觉神经网络系统复杂很多。大脑神经网络系统是一个全互联的神经网络,它更接近霍普菲尔德的全互联神经网络。但是大脑神经网络包含的的神经元的数量非常多,这也就使得这种全互联的神经网络在开始的时候并没有获得广泛的应用。模拟人的视觉神经网络的这种卷积神经网络则由于所需要的人工神经元数量比较少而更早实现。当然人的视觉神经网络也是具备了一定的认知能力的,这也是我们现在的深度学习神经网络能够在一定程度上模拟人类的思考过程,对文字、图像、音乐进行处理,并生成相应内容的原因所在。不过这跟真正的人类思考过程相比,还是有一定的差距的。这就说明了现在的AIGC还有非常大的改进空间。一方面它可以被进一步简化。因为相对人的大脑神经网络系统来说,视觉神经网络系统在认知过程当中所占的比重相对来说是比较少的。另外一方面也说明了今后还有更强大的类似于大脑神经网络的全互联的神经网络的出现。DeepSeek大模型让我们看到了希望。

由此也可以看出,我们目前的人工神经网络技术所依赖的芯片技术还有很大的改进空间。当然对于那些制造这些芯片的公司来说,投资风险也就相应的提高了。毕竟如果一个全新的技术出现之后,现有的芯片生产、设计技术要做完全的改变是非常困难的,就像现在很多传统的汽车产商要转型到新能源汽车都存在非常大的困难一样。昨天晚上到今天凌晨的英伟达等股票的大幅下跌就是一个在充分考虑到风险存在的情况下的一个价值回归的过程。

那么今后可能会存在哪些技术突破的方向呢?第一就是结构更加简洁的全互联的神经网络的出现。这种全互联的神经网络能够模拟人的大脑的思维,而不仅仅是人的感觉器官的某一部分的能力。第二就是可能会出现专用的神经网络芯片。这些专用的神经网络芯片可以放弃那些专门给图形显示提供的控制的功能。第三就是现有的大模型仍然会存在,但是它们会仅仅给模拟人的大脑的人工神经网络的提供视觉认知这一部分功能。鉴于目前的大模型已经非常强大,相信今后的人工智能大模型的智力水平会超过人类。

最后值得一提的就是DeepSeek创始人梁文峰先生最初是做量化私募基金的,在获得了最初的资本积累以后,创办了DeepSeek这个初创公司,网罗了一批优秀的人才来研究大模型。因此,从这里也可以看出股民并不是像很多人眼中那样的,是一群躺平的人,他们对实体经济还是非常大。中国早期的股民对国企脱困做出了巨大的贡献,目前来看中国的股民已经开始转型升级到了促进国家高科技事业的发展。



https://wap.sciencenet.cn/blog-361477-1470735.html


下一篇:DeepSeek技术革新撼动全球芯片格局:解析英伟达股价重挫背后的产业逻辑
收藏 IP: 113.99.16.*| 热度|

2 刘进平 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-27 13:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部