导读:蛋白质和RNA结构的实验解析远远满足不了需求,计算预测成为必须。蛋白质结构预测难,RNA结构预测更难,而对预测的结构模型进行的高精度修正更是难上加难。以熊鹏博士为第一作者,詹剑博士和我为通讯作者,与中山大学的巫瑞波教授合作一起发展的BRiQ-RNA方法可以对接近天然态结构的初始RNA结构模型有效改进,从而向最终实现高精度RNA结构预测的目标迈进了一步。实现高精度RNA结构预测必将为非编码RNA功能的发现及解释,RNA药物的设计与开发带来深远的影响。这个工作发表在Nature Communications 12, Article number: 2777 (2021)。
围绕蛋白质的研究长期以来一直是生物学家的工作重心之一,蛋白质似乎掌控着从催化化学反应、分子运输、结构支撑、免疫到调控生命过程的方方面面,但奇怪的是人类基因组只有1.5%是用来编码蛋白质的,而70%以上转录成为非编码RNA。越来越多的证据表明这些躲在幕后、以至少十倍于蛋白质数量的存在,起着许多不为人知的重要作用,冰山的一角才刚刚露出。
但是RNA比蛋白质更难研究。首先它化学上很不稳定,容易降解。更重要的是它的结构也不稳定,只有少数RNA能形成稳定的静态结构,可以被X射线晶体衍射、核磁共振和冷冻电镜等物理方法所解析,所以到目前为止,在PDB结构数据库里只有3%的结构含有RNA。没有结构作为线索,很难研究其功能,更不容说功能的机制了。
由于物理方法在解析多数RNA结构上有困难,所以通过计算来预测结构,虽然精度还是不那么可靠,也成为分子生物学家一个常备的工具。根据RNA-Puzzles(类似于蛋白质结构预测CASP比赛的RNA结构比赛),如果能够发现一个有结构的同源RNA,目前比较可靠的工具是同源建模,结构比较简单的小RNA有时也能预测得比较好,但是这些RNA模型必须在原子水平上进行高精度修正(refinement),因为从头预测往往从简化的模型开始的,而同源建立出来的模型往往有缺失的区域。可是目前可对RNA结构模型进行高精度修正的方法很少,而且往往只能在原来模型结构的附近进行极小范围的调整,因为结构很容易变得更差而不是更好,事实上,即使是发展了几十年的蛋白质结构的高精度修正也一直没有什么好办法。无论是蛋白质还是RNA,结构优化这么难的根本原因在于没有原子水平的高精度能量函数。
BRiQ-RNA,是以熊鹏博士为第一作者,詹剑博士和我为通讯作者,与中山大学的巫瑞波教授一起在澳大利亚格里菲斯大学开始合作,到深圳湾实验室后期完成的一个对RNA结构能进行高精度修正的方法。这个方法设计了一个完全不同于当今用于蛋白质和RNA的新统计BRiQ能量函数,因为蛋白质结构稳定的关键因素是方向性不大的疏水性,蛋白质多肽主链的构象决定支链的走向,而RNA结构稳定性的关键因素是方向性极大的碱基对的堆叠,碱基的配对决定了磷酸-核糖主链的走向。因此,BRiQ能量函数设计了以六维空间来描述方向性的碱基-碱基、碱基-氧原子、氧原子-氧原子相互作用为主,主链旋转异构体为辅的统计势,同时为了减少数据统计里面的非直接相互作用,BRiQ能量函数根据量子计算结果对碱基-碱基相互作用进行了矫正,最后BRiQ-RNA方法采用以碱基为中心的折叠树采样算法实现了对RNA三维结构模型进行原子精度水平上的改进。虽然改进的程度对不同的RNA有高有低,但对所有比较接近天然态结构的初始模型,不管是用什么方法预测出来的都能改进,从而在RNA结构的高精度修正上,往正确的方向迈出了重要的一步!该工作对未来RNA能量函数的发展、RNA结构的高精度预测、RNA功能的预测和机制研究以及药物开发都会带来较大的影响。
我们组通过计算和实验的结合,从事蛋白质/RNA的序列、结构与功能关系方面的基础研究和生物分子检测、药物开发方面的应用研究。寻找在RNA方面有计算和实验相关经验的博士后、科研助理和助理研究员。
论文标题:
Pairing a high-resolution statistical potential with a nucleobase-centric sampling algorithm for improving RNA model refinement
论文全文:
https://www.nature.com/articles/s41467-021-23100-4
从深圳湾实验室新闻转载,略作修改 (https://www.szbl.ac.cn/infomation/research/1018.html)。
转载本文请联系原作者获取授权,同时请注明本文来自周耀旗科学网博客。
链接地址:https://wap.sciencenet.cn/blog-472757-1287221.html?mobile=1
收藏