|||
生命科学就只有发论文吗?(130902)
闵应骅
生命科学如今很火。生物信息学用信息科学技术研究基因序列。反过来,生命科学能不能帮助解决信息科学中的问题呢?本文用信息存储的革命为例,企图来说明这一点,未知可否?欢迎批评.
以我这个外行看来,1990年开始的人类基因组计划,就像美国发动的一场运动,各大国都参与,中国也承担了1%的任务。大批雄壮的科研队伍开进来,搞信息科学的人也加入来帮忙解读这本天书。大量生命科学的文章,NSC的文章,影响因子达到几十。这些文章我们外行看不懂,但这些研究很热门,引用次数就多。信息科学方面文章的影响因子真是望尘莫及。外行人看到,现在可以做亲子鉴定,可以有转基因食品,但离医治癌症还不知道差多远。更多的是paper,那么,这方面的创新研究难道只能停留在纸面上吗?
最近,CACM发表一篇新闻“信息存储新途径”,引用了今年一月《自然》杂志上的两篇文章,介绍欧洲生物信息学研究所集中搞DNA存储,而MIT搞分子存储。
存储技术是信息技术的关键。几十年来,磁存储和固态存储一直是当前信息存储的基础。其性能包括存储量、存储密度、存储速度、存储寿命、读写可靠性等。而现在的个人存储设备已经接近其物理极限,改进余地已经没有多少油水了。正需要革命性的创新。人们注意到:DNA存储信息已有35亿年。DNA表示为四种成分的序列:A,G,C,T,可以翻译成二进制。非生命的DNA包含54898个数据块,每一个存储在单个的蛋白丝上。用3D打印机把该序列打印到DNA丝上,从而建造了一个实在的存储装置。用一本书做试验,编码这本书,写进去,读出来。该书的10亿个复印件就嵌入到了玻璃杯或小真空管的底部。DNA能够存大量数据,但DNA的制造过程比较慢,而且昂贵,也许光写入更现实一些。摩尔定律每年只改进1.5倍,而DNA测序技术现在每年增长10倍。所以,有人预计,5年以内此项技术即可商业化。这些写入和读出系统可以像计算机的USB接口一样,借助于计算机。但这种存储技术,目前来看,作为日常使用尚不适宜,而对于长期保存却非常有意义。这种数据在没有电的情况下可以存储50万年。而且取消膨大的存储网络,有利环保。现在的存储媒体,譬如CD,DVD等等都有格式的变化问题和相容性的问题,千年以后,即使数据还存在,但是人们已经没有读出的工具了。英国欧洲生物信息学院的科学家们编码DNA,写入马丁.路德.金的26秒讲演,一个照片,一篇学术文章和154 首莎士比亚的十四行诗。该DNA干燥在一块玻璃板上。研究人员可以99.99%的精确度读到这些数据。改正一个小故障以后,他们可以得到100%。不但要能读写,而且要建立适当的元数据和索引系统。不但能存千年,而且能被正确地指向相应的文件、装置或系统。斯坦福大学的科学家在研究用大肠杆菌中的活性DNA存储数字编码。这将有助于研究癌症、老化和有机体发育。
另一个方向是分子数据存储。MIT一个研究组研究分子存储。他们发现一种方法用分子组装成超分子,这种组装已经由加尔各答的印度科学教育和研究所组装成功。这种超分子捆绑着两类不同的原子:石墨烯片,包括碳原子和锌原子的薄片。当这些原子放置在磁性表面上时,磁化的超分子约1纳米大小,其存储密度达到每平方英寸1000兆兆字节(目前的硬盘小于每平方英寸1兆兆字节)。研究人员把一个分子材料薄膜放在铁磁体电极上,再在上面加第二个铁磁体电极。当一个电极的磁取向改变时,系统的电导性将有急剧的增加或减少。这两个状态就表示二进制码的0和1。MIT的研究人员发现,电导性的这两种跳跃,即使铁磁体电极只有一个,而不是一对,也会令人惊奇地出现。只有一个铁磁体电极的分子电导性的改变就可以极大地简化分子存储器的制造。存储密度1000倍的增加将改变从数据中心到个人计算机的所有装置。iPhone里同样大小的存储器,其容量不知道要大多少倍。当然还有大量工作要做。譬如科学家希望分子有两个稳定且非易失性的状态。现在是在-9华氏度,即约-27.8摄氏温度下工作的。要能在室内外普通温度下工作才能商业化。而且,这电导性的变化至少要从现在的20%提高到50%才行。也许需要10年,以及材料发明和制造技术的进步。
我不知道我们国内在这方面的研究是否有安排。我们高谈大数据,却只谈软件,基础设施建设,不谈下一代的存储设备,眼光就不够远大。我们往往是国外提出一个方向就跟进,较少有真正创新的方向。如果国外仅仅是一个idea,与我们处在同一个起跑线上,我们原创的东西就会多。当然,有我们自己全新的idea更好。这样的立项才真需要有眼光的评审。不要老盯着“我那份申请书怎么没通过呀?”。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-1 06:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社