零壹与或非分享 http://blog.sciencenet.cn/u/dthome9180 站得更高,才能望得更;远看得更细,才能找到好草

博文

地平线上的128位计算机系统

已有 1665 次阅读 2023-5-14 12:20 |个人分类:观点评述|系统分类:观点评述

2022年9月14日在Linux Plumbers Conference (LPC)会议上,Oracle的Matthew Wilcox宣讲了名为“Zettalinux: It's Not Too Late To Start”的报告,提出了尽快开始128位Linux开发的愿景。之后LWN.net发表了名为“The Road to Zettalinux”的文章并被广泛转载。这些都说明128位计算机系统的研究已经开始被工业界关注。

什么是128位计算机系统

计算机系统中大体上分为三种位宽(bit widith),指令位宽、数据位宽、地址(指针)位宽。当前指令和数据都已经存在128位以上的位宽,但是地址(指针)位宽最大只是64位,即所谓64位计算机。一般的,128位计算机的处理器应该具有128位宽的通用寄存器,具有128位的地址(指针)类型,线性地址位宽应该超过64位,具有超过2的64次方字节的用户地址空间。

为什么需要128位计算机系统

Matthew Wilcox主要从文件尺寸的发展趋势上给出128位操作系统的需求。回顾历史从32位到64位操作系统的主要驱动力就是对大尺寸文件的支持。文件尺寸增长趋势预测到2040年用户需要8EiB(2的60次方)的文件支持,只是单文件就需要63位线性地址位宽,操作系统应该在2035年完成支持。目前CPU处理器的最大57位线性地址位宽最大只能支持64PiB(2的50次方)。

从计算机用户地址空间的视角,Matthew Wilcox认为到2035年就应该出现支持128位用户地址空间的CPU处理器。

另外,本文认为值得注意的是无论CPU/GPU/TPU/DPU/NPU/FPGA等各种计算单元,还是新型存储工艺/统一共享内存/分层存储/分离存储/RDMA/NUMA/存算一体等等分布式存储系统,在地址空间上的需求是一致的的。

从更宏大的背景上看,大数据是未来信息技术的主要特征。据Statista网站分析,2023年大约每天产生的数据约为0.33 zetabytes,全年产生约120zettabytes数据,到2025年全年产生181zettabytes的数据,大概平均每年增长22%左右。按此趋势,到2035年全年新增数据将达到1.32yattabytes。Zetta量级的数据需要2的70次方空间表示,Yatta两级的数据需要2的80次方空间表示。

人工智能是未来信息技术的主要应用模式,而机器学习是主要计算范式。目前DNN模型的参数规模非常的庞大,例如大模型GPT-3具有175 Billion参数,如果每个参数用半精度浮点FP16表示,需要326GB的存储空间。据估算GPT-4具有100 Trillion参数,估计所需存储空间将达到200TB量级。而且机器学习大模型的规模仍然在加速增长。

https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8

如何开展128位计算机系统研发

首先,128位RISC-V指令系统架构研究,开发指令级模拟器和系统集模拟器。笔者认为尤其关键的是128位虚拟内存的研究,解决虚实地址转换(MMU/TLB)相关的性能瓶颈和硬件开销,需要新型的有别于传统树形页表结构的虚拟内存系统。近些年出现的大量新型TLB研究,如混合大页TLB,Hash TLB和Range TLB,都是很好的技术积累。

其次,支持128位计算机系统的编程语言和编译器,Matthew Wilcox在报告中给出了一些Linux内核和C语言中128位指针类型表示的建议。CHERI项目已经在128位指针支持方面做了大量的工作,并联合ARM开展原型芯片和计算机系统的开发,在编译器和操作系统方面都积累了大量的成果,是未来128位计算机系统研发的重要技术积累。但值得注意的是CHERI的指针虽然是128/256位的,但是线性地址位宽仍然是64位,指针的高位保存的是支持内存安全检查的指针标记,因此CHERI并不能算作是纯128位计算机系统。与CHERI类似的还有IBM i virtual instruction set,是在IBM System/38 AS400等的基础上发展而来的。但也是采用标记指针(Tagged Pointer)的技术,只支持64位地址空间。

再次,支持128位计算机系统的Linux操作系统。Sun/Oracle开发的OpenZFS(Zettabyte File System)是128位的文件系统,是128位操作系统的重要研究基础。ZFS在32/64位计算机上开发,通过系统调用和函数库将128位指针拆分成64位计算和寻址。

总之,大数据应用对128位计算机的需求非常急迫,世界上128位计算机系统的指令系统架构、编程语言和编译器、操作系统内核和文件系统等等已经存在一定技术积累。128位计算机系统的研究势在必行,是未来信息技术发展的基础性研究和新赛道,应该引起工业界和学术界的广泛重视。马上开始行动!




https://wap.sciencenet.cn/blog-102148-1387931.html

上一篇:处理器指令系统漫谈(16):历史
收藏 IP: 114.243.116.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-3 02:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部