科技导报分享 http://blog.sciencenet.cn/u/kejidaobao

博文

系统芯片的自然统一

已有 3683 次阅读 2011-4-28 10:44 |个人分类:栏目:卷首语|系统分类:观点评述| 科学家, 研究所, 研究员, 处理器, 计算机应用

沈绪榜,湖南临澧县人,中国科学院院士。历任航天工业部骊山微电子技术研究所副所长、研究员,中国宇航学会第一届理事,现任西安微电子技术研究所研究员。长期从事电子计算机的总体逻辑设计,参加中国大型系列电子计算机的研制,领导运载火箭计算机的总体逻辑设计,其成果1985年获国家科技进步奖特等奖。著有《微型计算机》等。
 
      1970年代发展起来的处理器芯片使计算机的指令集合体系结构(Instruction Set Architecture,ISA)设计转移到了芯片上来,实现了计算机的廉价制造和批量生产,促进了计算机产业和电信产业的发展,使9亿人口进入了知识社会。随着芯片集成度的上升和计算机应用的发展,1987年科学家提出了系统芯片(System On Chip,SOC)的概念,目标是使计算机的设计都演变到SOC设计上来,成为处理器芯片的换代技术。现在,虽然1Petaflops的MPP(Massively Parallel Processing)计算机已经问世,但其一般应用效率只有峰值运算速度的5%—20%,SOC的并行计算模式和体系结构还未演变到成熟的地步。
      现实世界中的不少问题往往是可以用多种算法,按多线程/任务并发地求解的。基于计算机的网络通信,每发送1条短信要涉及到后台服务器的许多线程,特别是在短信峰值时间内,每秒甚至会有数亿个线程并发的工作。并发的应用特征促进了任务/线程级并行(Task/Thread Level Parallel,TLP)计算模式的发展,处理器芯片演变成了多核/众核的CPU系统芯片。许多MPP计算机就是按照TLP计算模式工作的,线程是在处理器(核)上串行执行的,是一种MTMD(Multiple Thread Multiple Data)的粗粒度的并发计算,使线程之间存在同步和互斥问题。
      芯片是在火箭制导控制系统中开始嵌入融合应用的。嵌入式计算机除了处理器之外,传感器实现了人的视觉、听觉与感觉等能力,执行器实现人的四肢等能力。嵌入式计算机处理的大量信息主要是视觉信息,促进了图像处理的细粒度并行的数据级并行(Data Level Parallel,DLP)计算模式的发展,开发出了DLP计算模式的SIMD/Multi-SIMD的GPU(Graphic Processing Unit)系统芯片。实际应用说明,DLP计算模式的GPU系统芯片,完成地震成像等数据并行算法的计算效率,要比CPU系统芯片的高百倍。于是,不仅有了DLP计算模式的MPP计算机,而且有了TLP+DLP计算模式的MPP计算机。由于现在的CPU系统芯片和GPU系统芯片的体系结构是不同的,TLP+DLP计算模式的MPP计算机存在着不同芯片之间的比例分配和数据传输问题。因此,有了通用的GPU,也就是所谓GPGPU系统芯片的研究。
      对于非数据并行算法,现在只有OLP(Operation Level Parallel)计算模式的ASIC/FPGA等阵列芯片,可以使操作流水的深度和操作并行的长度都没有限制。实际应用说明,ASIC/FPGA等阵列芯片对非数据并行算法的计算效率,要比CPU系统芯片的高百倍。阵列芯片常用作芯片设计的模拟器和MPP计算机的协处理加速器,因为算法是通过电路设计/逻辑设计映射到这些阵列芯片上的,没有指令流的编程灵活性。
      计算机自问世之后首先是作为模拟工具使用的,计算模拟推动了MPP计算机的发展,已经有了1Petaflops计算速度的MPP计算机,1Exaflops计算速度的MPP计算机正在研制之中;据估计,化学研究将需要1Zettaflops的计算速度。由于TLP、DLP、OLP这3种计算模式的芯片体系结构是不统一的,没有减轻甚至加重了MPP计算机的“效率墙”、“编程墙”、“功耗墙”、“存储墙”和“通信墙”等问题。
      计算机是用来研究我们周围的一切事物的,人们可感知的3维空间中的事物是随一维时间而连续演变的;从应用上,SOC体系结构应该是与事物的四维时空演变自然统一的。SOC体系结构是应用和实现之间的桥梁,从实现上,SOC体系结构也应该是与制造技术的演变自然统一的。按照摩尔定律的应用实质,芯片制造技术的基础作用就是使计算机和电子产品变得更小、更轻、更冷、更快和更经济智能。一次集成的芯片技术是以减小特征尺寸而延长摩尔定律的,研究表明每10年就会出现一代更小和更廉的计算机。现在的芯片集成度已高达10多亿晶体管,为阵列存储器(array memory)和阵列处理器(array processor)的研制创造了条件。但65nm之后开始出现了漏电流、线延迟和故障率等所谓的红墙(Red brick Wall)问题,还有特征尺寸的极限问题。为了延长摩尔定律,除了研发晶体管新架构以降低功耗外,IBM、Intel与Samsung等公司还开发了二次集成的TSV(Through-Silicon-Via)技术,可使芯片的互连线缩短1000倍,引出头增加100倍。美国休斯公司在1987年10月就采用了这种一次和二次集成技术自然统一的发展策略,在3?滋m CMOS工艺的基础上,开发了WSI(Wafer Scale Integration)技术和TSV技术,研制成功了一种航空航天图像处理的32×32个16位的定点PE阵列的SIMD体系结构的MPP计算机,体积只有手掌大小。
      1994年开始,我们也研制了16位字长的有32个处理元的每秒3.2亿次的阵列处理器芯片,和单指令流的4096个处理元的SIMD体系结构的MPP计算机。按照现在的自然统一的一次和二次集成技术,我们将1966年Flynn提出的SISD、SIMD、MISD和MIMD等4种体系结构加以合并,提出了单指令流SI(SD+MD)=SISD+SIMD的DLP计算模式,与多指令流MI(SD+MD)=MISD+MIMD的指令级并行(Instruction Level Parallel,ILP)计算模式;研究了以阵列处理器和数据阵列(数组)存储器为基础,实现单指令流的DLP计算模式的SOC体系结构设计。在这种DLP计算模式的SOC体系结构的基础上,把数组存储器也作为多指令流的ILP计算模式的指令阵列(指组)存储器使用;使阵列处理器也可以完成的多指令流的ILP计算模式,并能等效地取代OLP计算模式,于是就实现了ILP计算模式的SOC与DLP计算模式的SOC体系结构的自然统一,把TLP计算模式在CPU系统芯片上粗粒度并发的低效计算,转化为DLP+ILP计算模式统一的SOC上细粒度并行的高效计算。
      芯片是知识社会的技术要素,计算机和电子产品的经济性和发展前景,都体现在芯片的技术含量中。但在我国的进口产品中,芯片还是占用外汇最多的项目。有理由相信,在“十六专项”战略任务的牵引下,抓住SOC体系结构尚需统一的发展机遇,研究系统芯片的自然统一,实现国产芯片的跨越式发展,是能打破国外芯片的垄断局面的。


https://wap.sciencenet.cn/blog-336909-438171.html

上一篇:《科技导报》“博士生创新研究资助计划”2010年评审结果公示
下一篇:科技新闻媒体关注指数排行榜(2011-04-11至2011-04-20)
收藏 IP: 123.124.137.*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-3 06:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部