||
转录因子因子富集分析背后的原理与GO,KEGG等富集分析是一样的。
这里还是使用Y叔的R包“clusterProfiler”。
首先我们要知道哪些基因是转录因子,并且属于哪一个转录因子家族。这个信息可以在这里下载(https://pan.baidu.com/s/12Zi-FvySMuaWyM2b9_2yuA)。这个文件中只需要两列,一列是转录因子家族的名字,一列是基因的名字。根据这个文件,整理出共有多少个转录因子家族,并给每个转录因子家族一个唯一的编号。将编号和名字存入一个新文件。
上面是所有转录因子,首先要筛选出在我们样品中表达的转录因子。
其次需要确认差异表达的转录因子。
最后需要一个转录因子编号和名字的对应文件。
样品中表达的转录因子,输入格式如下:共两列,第一列是转录因子家族编号,第二列是基因ID。其中编号是根据刚刚下载的文件整理而来。即一个基因家族有唯一一个编号。
差异表达的转录因子,输入格式如下:只有一列,基因的ID
image-20181113214653231还需要是一个转录因子ID和名字的对应文件,输入格式如下: