(转载自:《中国药理学与毒理学杂志》. 2023年9月.第37卷.专家论坛)
从网络药理学到能力组学(Capomics)
熊江辉
摘要
本文提出能力组学(Capomics)的概念,能力组学Capomics是Omics of Capability的缩写,即从不同尺度和维度上测量表征人体内在能力的方法。本文同时也提出了一种通用的能力计算框架,即通过各个功能单元(如信号通路)的衰老程度,得到该功能单元的能力表征。通过体液(如全血、唾液)的DNA甲基化测量以及大数据比对,可以得到任一用基因集合表征的功能单元的老化指数。因此,通过“一管血”/“一管唾液”实现多尺度全维度能力表征是可行的。本文还展望了能力组学在中医西医融合中的应用前景。
关键词: 网络药理学 能力组学 表观遗传学 DNA甲基化
随着现代生命科学的进展,现代生物医学在从现象观察到抽象提炼上取得了新的进展。一方面,系统生物学、网络药理学的研究使人们认识到基因网络的特征性变化是疾病、药物作用的本质特征,制药工业也在探讨从靶向分子向靶向信号通路的思路扩展。另一方面,科学家试图从宏观整体角度把握健康和疾病的本质属性,一系列健康与衰老、疾病的 hallmarks(本质特征,或共性特征)的提出是其典型代表。2020年,笔者提出“能力即靶标”的观点。认为应在生命体的结构(Structure)、功能(Function)之外,提出单独的内在能力(Capability)概念。疾病干预、药物治疗靶标本质上是靶向生物体的内在能力。由于生命体的复杂性,需要从细胞分子、到器官系统、到行为表型等多个层面测量、表征人体的内在能力。本文提出能力组学(Capomics)的概念,能力组学 Capomics 是 Omics of Capability 的缩写,即从不同尺度和维度上测量表征人体内在能力的方法。本文同时也提出了一种通用的内在能力计算框架,以及能力组学在中医西医融合中的应用前景。
1 能力(Capability)的理论基础
随着现代细胞、分子生物学的发展,科学家尝试从整体角度、从系统的高阶属性上了解生命体的本质特征,寻求疾病治疗的新思路。
1.1 Hallmarks(共性特征)理论体系
几大Hallmarks(共性特征)的提出与广泛传播是现代生物医学试图从整体角度、从系统的高阶属性上进行探索的典型代表。
2000年,Hanahan教授和Robert A. Weinberg教授共同在著名的《Cell》杂志上发表了综述《Hallmarks of Cancer》(癌症的共性特征)。该文章很快成为领域内的经典,并成为《Cell》历史上被引用次数最多的综述之一。这表明该理论体系对癌症领域研究具有重要的指导或参考作用。该理论总结了癌症的6个标志性特征,包括自给自足的生长信号、对生长抑制信号不敏感、逃避凋亡、无限复制的潜力、持续的血管生成和组织浸润和转移。2011年,作者又提出了第二版,在原有6个特征的基础上增加了4个特征,分别是细胞能量代谢的失控、逃避免疫清除、肿瘤促炎症作用、基因组不稳定性和突变。2022年的第三版,在既往10个特征的基础上,再次增加了4个特征,分别是解锁表型可塑性、细胞老化、非突变表观遗传重编程和多态微生物组。至此,癌症被归纳为有14个共性特征[1-3]。
在衰老方面,2013年,《Cell》杂志发表题为《Hallmarks of Aging》的综述论文,系统归纳了衰老的本质特征[4]。这九项特征为:基因组失稳、端粒损耗、表观遗传学改变、蛋白质稳态丧失、营养素感应失调、线粒体功能障碍、细胞衰老、干细胞耗竭和胞间通讯改变。2023年作者又对该体系进行了扩展,增加了三个新的衰老特征:失能的宏观自噬、慢性炎症和微生态失调[5]。
在健康表征方面,2021年,《Cell》杂志发表题为《Hallmarks of Health》的综述论文,从细胞分子生物学的角度,归纳了健康的本质特征[6]。作者将健康定义为能维持机体组织和生理机能的动态稳定状态。归纳健康的共性特征为三大板块八个方面:一是空间区隔稳定性(屏障完整与局部扰动的遏制)、二是维持体内平衡(回收和周转、通路的完整性、节律性调控)、三是对压力的反应(稳态复原能力、激效反应管理、修复和再生)。
总体来看,上述Hallmarks的总结是一种由下而上的归纳,并非基于一个逻辑基点的演绎,有越总结越多的趋势,且主要局限于反映细胞分子水平的特征。
1.2 什么是能力(capability)概念?
逻辑基点:追求在时间上的连续性,即可持续性,是生命体的本质特性。
定义:能力(Capability),定义为生物系统适应环境的一系列能力的集合,是实现个体和物种的可持续性的手段,也是生物体的本质属性。
结构与功能,是生命科学研究中的两个基本概念。这里笔者把功能定义为对应具体结构体的功能属性,而能力概念,则是指跨结构体的功能集合,其本质属性是对未来环境变化的适应能力,以实现其可持续性。
现代生物学与医学研究,聚焦结构及其功能的关系研究,因此其关于疾病的研究视角、药物研发的目标大都是瞄准结构的分析,例如,基因变异的分析、基因转录的变化,都是结构方面的研究。
既然能力本体是生命体的本质属性,它具有哪些基本特征呢?
(1)能力的可持续性。生命体生存过程,也就是一个其对能力进行测试、优化的过程,在进化上有益的能力变化,可以通过DNA编码、储存,也可以通过表观遗传学机制,通过DNA甲基化等信息进行传递。因此,遗传物质和表观遗传信息,是能力的信息储存载体。
(2)能力是动态的。由于未来面临的环境具有不确定性,在进化与自然选择情况下,生命体的能力集合,包括适应当前环境,也包括适应未来环境的能力。随着环境的变化,能力集合是动态可变的。
(3)能力是路径依赖的。能力与种群的进化路径、个体的发育环境暴露史有关。适应某种路径的能力,如果突然换另一个环境,可能适应力下降。
在结构(structure)与功能(function)研究之外,把能力(capability)研究单独提出来,有如下考虑:首先,从基因网络的角度来看,结构、功能研究往往涉及网络的局部(local)属性,能力则往往涉及网络的全局(global)属性、高阶(high level)属性,需要单独予以关注与研究。其次,能力是可计算的,从能力的角度,可以建立由上而下的能力体系,在不同尺度上定义和计算能力特征,方便我们在不同尺度、精度上把握个体的健康特征。
1.3 能力(capability)即药物靶标
疾病治疗的靶标,除了靶向结构体,更应着重靶向能力。这是因为能力的变化具有收敛性,在时间维度上连续性较高,可变性小。而结构体的变化具有发散性,可变性很高。例如,药物可以靶向癌细胞突变,但是癌细胞群体在选择压力下发展出新的突变,则药物失效。
进一步而言,药物治疗策略的制定,应充分考虑生命体、药物、时间这三个变量所形成的新系统。许多当前的药物是只靶向当前结构体,没有靶向未来的结构体。药物进入人体,就开始了一个药物与人体的协同演化过程,药物对人体而言,是一个新的“环境刺激”,人体内各个细胞组织系统会按照其自有的逻辑处理药物的刺激,通过结构、功能重塑而适应药物这个环境刺激。靶向单一结构体的单一结构单元,例如基因突变,其效率是较低的,因为结构体会通过重塑对抗外来刺激(药物)。
以能力为靶标,应该具有选择性(特异性)。这是由于生命体在结构和功能重塑中要消耗资源,而资源是有限的。同时,如果靶向的能力集合过大,生命体将减少稳健性。因此,识别疾病特异的、个体特征的能力靶标尤为重要。
2 能力(capability)的可计算性
是否存在在不同尺度上定义能力(capability),并进行能力计算的通用方法?基于近年来DNA甲基化生物标志物、DNA甲基化衰老时钟的研究,笔者提出一个在各个尺度上定义和计算能力capability的通用方法思路。
2.1 能力计算的基石-DNA甲基化衰老时钟
通常提到的年龄概念可以分成两种:(1)时间年龄(Chronological Age),也就是从出生到现在的时间总和;(2)生物学年龄,受基因、生活方式、行为、环境和其他因素的影响。生物学年龄是衡量真实年龄的重要指标,也是具有生物学相关性的重要特征之一,因为它与死亡率和健康状况密切相关,有时候也用“生理年龄”代称生物学年龄。通常认为时间年龄并不能非常准确地是预测死亡限期,或者说不能预测在世的时间。生理年龄是个更准确的预测指标,生理年龄是将身体中细胞的退化速度与普通人群相比的衡量指标。每个人的遗传基因以及生活方式(如饮食、运动、体重、压力和吸烟或饮酒等习惯)不一样,生理年龄与时间年龄的差异可达30年。
衰老时钟(Aging Clock)综合了生理年龄量化与健康寿命预测的功能。衰老时钟有很多种,包括端粒长度、转录组、血浆蛋白组、DNA甲基化组,甚至外貌等,这些都与年龄相关,区别是精确度不同。DNA甲基化时钟(DNA Methylation Clock)是目前公认最精准的衰老时钟。
DNA甲基化是指在DNA甲基化转移酶的作用下将甲基(-CH3)选择性地添加至DNA上的过程。在不改变DNA序列的前提下控制基因的表达,在多个生物学过程中发挥重要作用,包括衰老、疾病的发生和发展。2013年,美国UCLA大学的生物统计学家Steve Horvath在Genome Biology 杂志上发表研究文章,发现人类不同组织和细胞类型的生理年龄与基因组DNA的甲基化程度高度相关。随着人类年龄的增长,基因组DNA上甲基化修饰程度呈现总体降低,部分增高的趋势。通过机器学习算法,科学家建立了由多个CpG甲基化位点作为输入的年龄拟合算法模型,能准确预测大部分细胞和组织年龄,该算法称之为“DNA甲基化时钟”。在健康人的大部分组织中,时间年龄和DNA甲基化时钟推测的生理年龄有0.96以上的强相关性。
2.2 基于DNA甲基化衰老时钟的能力计算
基于上述DNA甲基化衰老时钟计算,我们提出一种通用的能力定义与计算方法:
第一步,表征。
给定任一系统,假设该系统可以由一个特定的基因集合来表征。
第二步,拟合。
假设该系统的能力(Ci)随年龄、衰老而减弱,那么我们可以建立一个年龄拟合模型,该模型的输入(x)为该基因集合的特征测量值,模型的输出(y)为时间年龄。
第三步,生理年龄。
如果该模型在统计上显著相关,那么对于任一受试者j,通过其基因集合的特征值测量,可以得到一个拟合的生理年龄(Aij)。
第四步,能力计算。
上述该系统的生理年龄Aij已经反映了第j个受试者的第i个能力特征。如果要给出一个归一化的能力值,这是一种计算方式:
这是一种有趣的变换,暂时假设人类一个理论寿命值为120岁,能力最强的年龄为20岁,能力最弱的年龄为120岁,这里给出了一种示例性的变换,将Aij转换为取值在0到1之间的能力值Cij。
其实,我们在日常生活中已经自觉不自觉地用上了上述逻辑。现在越来越多年轻人因心梗、抑郁自杀等离世,人们往往会说,“某人30岁,却有一个50岁的心脏”,来反映其特定系统能力下降、衰老加速的情况。
通过对某个体进行DNA甲基化的测量,我们可以推算出任何可定义系统的生理年龄,进而推算其能力变化。
3 能力组学(Capomics)
能力组学Capomics是Omics of Capability的缩写,即从不同尺度和维度上测量表征人体内在能力的方法。
3.1 基于本体论的能力推理,是能力组学的重要研究内容
为什么要提出能力组学的概念呢?在现有常见的生物组学研究中,本体论(ontology)是一个相对固化的体系,也是许多研究的终点。大多数研究都是先找出差异基因,然后通过基因功能富集分析,使用基因本体论(gene ontology)或者分子路径数据库来解读差异基因集合的特征。
假设我们针对一个复杂的疾病,如抑郁症,通过系统的研究,发现抑郁症病人群体中有以下显著异常的路径:1. 应激信号的处理能力下降;2. 代谢异常;3. 由于心肺功能异常导致组织缺氧;4. 由于干细胞增值和分化能力下降,导致神经修复功能下降。5.持续的慢性炎症。(请注意,这里只是为了示例性的说明,不代表上述路径是关于抑郁症致病路径的研究结果)。每个路径下面,可能有不同的分支,例如,代谢异常可能是脂代谢异常,或者蛋白质代谢异常。我们可以通过全基因组DNA甲基化的测量,对上述致病路径中的所有分子路径进行老化/异常指数的计算。但是,由于目前大多数生物本体论(gene ontology)或通路数据库来自于专家注释,只反映当前已获得的知识,通过扫描所有生物学概念的老化指数,无法精确计算每一个生物学概念所代表的能力下降,无法自动实现从微观特征到宏观特征的推理。
因此,能力组学的研究,一方面是依据现有生物学概念进行能力的计算,一方面,更重要的是,利用数据驱动的方式产生新的生物学概念,即新的本体(ontology),形成计算驱动的能力概念。进而对这些概念本体之间的层级关系、依赖性关系进行建模,以期实现从微观特征的异常到宏观特征异常的推理能力。值得注意的是,MsigDB数据库(The Molecular Signatures Database)已经开始尝试将专家注释和数据集成的方式结合起来,定义新的数据集,即 “共性特征基因集合”(hallmark gene set)。
可以预见,能力组学的研究将促进现有几大类本体论知识库的融合、迭代升级。包括基因本体论(gene ontology)、信号通路(KEGG pathways, Reactome pathways etc.)、人类表型本体论(Human Phenotype Ontology)等。笔者认为,来自中医理论的特征,经过量化表征后,也可以融合进来。
3.2 短板分析,是能力组学的特色方法
能力组学与系统生物学(systems biology)有本质的不同。能力组学研究检测的对象是系统的能力,更具体而言,在医学场景下,其关注的重点是系统的短板,而不追求该层级系统运行细节的详细掌握。在当前的生物医学研究中,科学家往往习惯用一个词“mechanism”(机制)。这个词被使用的范围如此之广,以至于可能许多研究人员认为医学研究就一定要搞明白一个系统的机制,搞不明白就没办法诊断和治疗疾病一样。Mechanism一词来源于机械学,即一个系统的物理构成以及各个单元之间的关系,特别是动态关系。大多数系统生物学研究,也是试图勾勒出各个分子之间相互作用关系,这个关系非常复杂,形成一个分子路径(pathway)或网络(network)。
基于能力短板的能力下降分析,又称失衡分析,则可以将多个能力维度归一化到同一个维度空间,使它们具有可比性。通过各个子系统的短板分析,进而汇总得到全局系统的短板,实现跨层级短板计算。这种只需要保留各个层级的短板信息,类似深度学习图像识别里面的特征生成,比如,通过像素的特征总结出来图中有两个眼睛,有一个鼻子一个嘴,并最终总结出来这是一张人脸的图像。
在复杂疾病,特别是老年性退行性疾病研究中,基于系统生物学的思路,需要枚举所有可能的致病分子作为治疗靶标,对分子之间、各层级之间依赖性等信息的遗漏,容易在药物研发的后期出现一些之前未掌握的毒副作用,从而导致药物开发的投资失败。
近年来,复杂性科学的研究表明,宏观特征有时候呈现出比微观特征更强的因果性,例如更强的表型相关性。这种现象称为“因果涌现”。随着越来越多的微观特征,例如单细胞层次特征不断出现,如何从微观特征批量生成表型相关性更强的宏观特征,从而实现从微观能力到宏观能力的推理,将是一个具有潜力的技术方向。
(未完待续)
转载本文请联系原作者获取授权,同时请注明本文来自熊江辉科学网博客。
链接地址:https://wap.sciencenet.cn/blog-508476-1404284.html?mobile=1
收藏