||
写在前面
一般而言,基因富集分析指的是给定一个基因集与先验表型(比如生物过程、信号通路或疾病等)的富集程度(显著性p值衡量)。如果p值越小,该基因集在统计水平下与某些先验表型显著性相关。因此,基因富集分析搭建了基因型与表型之间的桥梁。以往,基因富集分析专指编码基因的富集分析。那么作为非编码的miRNA如何进行富集分析呢?今天就介绍一款在线miRNA富集分析工具:miRPath。该工具是DIANA系列之一(miRNA有个DIANA系列),并且专注于miRNA在KEGG(Kyoto Encyclopedia of Genes and Genomes,https://www.kegg.jp/)信号通路方面的富集分析。
01
—
miRNA富集分析
给定一个基因集(许多基因名称组成一群基因),一般使用超几何分布检验(hyper-geometric test)来度量该基因集是否显著性富集于某些表型。直接上一个超几何分布检验公式如下:
(1)
上式(1)中,N代表背景基因个数,K代表背景基因中与表型相关的基因个数,M代表给定基因集中的基因个数,x代表给定基因集中与表型相关的基因个数。
先前说了,式(1)一般适用于编码基因的富集分析。miRNA富集分析需要分情况。第一种情况:如果miRNA与表型有直接相关的表型(例如miRNA与疾病之间的关系数据库),那么式(1)也适用于miRNA富集分析。第二种情况:如果miRNA与表型没有直接相关的表型,那么式(1)就不能够直接应用于miRNA富集分析。注意,第二种情况虽然不能够直接应用,但是不代表不能够间接应用哦。在前面(miRNA是何方神圣?),我们已经了解到:miRNA能够调控编码基因。一群miRNAs当然能够调控一群编码基因。那么我们可以通过一群miRNA调控的编码基因富集分析来间接实现miRNA富集分析。
02
—
miRPath
miRNA在KEGG信号通路的富集分析就属于上面说的第二种情况。因此,miRPath工具首先使用miRNA靶标数据库(TarBase、microT-CDS或TargetScan)来敲定给定miRNA集能够调控的编码基因(图1)。然后基于式(1)来预测给定miRNA集调控的编码基因与KEGG信号通路的富集情况。这个富集分析结果就是miRNA集的富集分析结果。
图1 miRPath主页
后话
miRNA富集分析的间接方式在其他许多方面也适用。例如,在说话方面,有些人不想直接表达,往往选择间接表达(也叫委婉)来达到自己想传达的信息。然而,间接始终归间接,在传递信息保真度方面,与直接还是有一定差距。为了求真务实,还是直接点好!
参考链接:
[1] Vlachos IS, Zagganas K, Paraskevopoulou MD, et al. DIANA-miRPath v3.0: deciphering microRNA function with experimental support. Nucleic Acids Res. 2015;43(W1):W460-W466.
[2] http://snf-515788.vm.okeanos.grnet.gr
更多背景知识如下:
1. miRNA是何方神圣?
号外,ceRNA可是miRNA介导的哦。为了便于交流,我们为miRNA介导的ceRNA研究在Frontiers in Molecular Biosciences杂志( 2020_IF = 5.246)整了个专刊,主题为“Computational Identification of ceRNA Regulation”。投稿链接:https://www.frontiersin.org/research-topics/24340/。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-1 06:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社