精选
|
虽然大模型在输入层的特征量级上不大,也虽然不少人认为把大模型做大做强,是能确保通向AGI的希望之路,但这并不意味着只有这一条路可行,至少自然界就不一定会这么认为。
“自然界”想得更多的是,提供每个生命体管够管饱的感知能力,来适应这个变化多端的世界。
不妨先看看我们人类在感知能力上的表现。正常人类接受信息的80%是来自视觉,而视网膜就像是一个神经网络的输入层,上面用来感受外部视觉的主要有两种神经元细胞。视锥神经和视杆神经,数量有多少呢?视锥(cone)细胞数量约600万到700万个;视杆(rod)细胞约1.2亿个。视锥数量虽然只有视杆的20分之一,但它对人视觉的重要性要大得多,因为它主管白昼视觉,对细节颜色更为敏感,所以光线经眼睛晶状体进入后,焦点通常落在视锥细胞聚集的中心凹位置。而视杆细胞虽然多,但主管夜昼视觉,负责感知运动的变化。所以,夜间开车时,往往得不到好的细节分辨,更得小心行车。视杆细胞数量太多,为了节省资源,其通过盲区向视觉通道的神经传输信号时,常采用多对一的连接方式。而视锥则是一一连接。窄看起来,视杆细胞向后的多对一的构造方式,很像卷积神经网络的卷积。
人类的视觉虽然强,但自然界并没有以人为标准模板,而是给其它依赖视觉的生物如猫、苍蝇赋予不同的能力表现。猫的视杆细胞数量是人类的5至6倍,而视锥则是人类的1/5左右。这意味着猫在晚上比人类能看得更为清楚,夜视能力更强,而白天反而不行。为了避免光线过度引起的不适,猫的瞳孔在白天会缩成一条线。另外,视杆细胞的放量可能也让其对光线的变化、运动的变化更为敏感,以至于它能对蛇的攻击多数情况下都能表现了应对自如。当然,好奇害死猫的本性,也经常让猫容易犯低级错误,导致处置失当。再说说苍蝇。苍蝇具有360度全景视角的复眼,由4000到6000个小眼组成,每个小眼又有约8个感光细胞。虽然数量不多,但物理学家费恩曼曾在他的《物理学讲义》中估算过,如果人想具备和苍蝇一样的复眼能力。眼睛的尺寸会比人的头还要大,结果,整个头就会被一只眼占满。
相比较而言,人类制造的视觉感光元件在量级和能力方面都还有相当多的改进空间。比如人工智能领域特别依赖视觉的自动驾驶领域,多数摄像头约800万像素。如果像素级别达到上亿,就会面临发热问题,以及需要的算力难以支撑和形成快速响应的问题。而人类视觉还有很多独特和奇特的功能,比如人类的亮度自适应能力在快速反应和适应范围两方面都比现有人造的摄像头要强不少。
除了视觉,自然界的生命在嗅觉方面也可圈可点。比如我家的小狗,有回遛的时候突然狂奔,居然是因为大约400米远的一滩尿,可见其嗅觉之灵敏。猫狗的嗅觉是远超人类的,从量级上就能看出。据报道,猫的嗅觉受体数量约2亿个,狗的也差不多,比如中华田园犬约1.2亿,德国牧羊犬则达2亿,而人类仅500万。所以,机场的缉毒任务基本由缉毒犬来担任,它们靠闻就行了。而人类在嗅觉仿生一块还很弱。
我们身体的皮肤也包含了巨量的传感器,包括温度、痛觉、压力和触觉感受器。其中,触觉感器全身约500万,痛觉200-400万,温度感受器每平方厘米约12个热感受器和12-13个冷感受器,压力则是每平方厘米35个。而在分布上,也在细微差异。背部的感受器密度就小于手指指尖和嘴唇等部位的。这些感受器构成了复杂且包含巨量参数的输入网络。
相比较而言,人类在复制相关的感受器或传感器上,就相形见绌了。虽然能在某些感受器的数量级方面达到接近的程度,但表现出来的性能还是差强人意。比如人可以轻松用两只手旋开矿泉水瓶,而目前的机器人或机械手似乎都无法展示这一能力,网上能看到的通常会将矿泉水瓶的一端固定后,再拧另一端。这其中的差距,与手上传感器的丰富程度不无关系。
为了能让机器人具备人一样的有丰富感知能力的皮肤,2025年末时,英国剑桥大学和伦敦大学学院的科研团队在《Science Robotics》(科学 机器人学)上发表了他们关于柔性皮肤的最新成果。该皮肤由亲水的三维网络结构凝胶组成,可以塑造复杂的形态,也能够同时感知温度、压力等信号,还包含一圈电极和一套识别系统。但是,受技术条件限制,它的反应时间是相对滞后的,且在高温环境下性能不稳定,也难以进行大面积的布置或替代。
显然,自然界在生命的传感器或感知方面是花了大力气重金打造的。如前所述,这里面的成功与失败是有过上亿年的经验总结。而人类在生命科学的历史,即使从人类文明开始算起,也不长。再考虑到分子生物学的出现,那就更短,不到一百年,与自然界的历史相比,几乎可以忽略不计。据说与薛定谔的科普书《生命是什么》有关。该书导致了两个学科方向的出现,一是人工智能,另一是分子生物学。但分子生物学或生命科学这个方向又不能像人工智能那样,无法异常快速地生成数据。这也就意味着,我们在打造与自然界类似性能的综合传感器网络方面还有相当长的路要走。这里的长,不仅包含技术层面,也包含了时间。
也需要指出的是,自然界重感知的做法,和目前人工智能轻输入,重后端的深层网调参优化是完全不同的路子。但到底谁算野路子,不好说。
另外,还有一个需要思考的问题,打造足够丰富的感知网络是否有助于降低能耗?
张军平
2026年1月18日
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-1-18 12:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社