|
一、CARD-RGI简介
RGI(Resistance Gene Identifier)是由 CARD(Comprehensive Antibiotic Resistance Database)团队开发的核心生物信息学工具,主要用于在微生物基因组或宏基因组数据中准确识别抗生素耐药基因(Antibiotic Resistance Genes, ARGs)。该工具通过将用户提交的核酸或蛋白质序列与CARD数据库中经过严格审阅的抗性基因参考序列及隐藏马尔可夫模型(Hidden Markov Models, HMM)进行比对,实现对ARGs的高灵敏度与高特异性检测,是最常用的ARGs预测工具之一。
RGI 不仅能够识别已知的抗性基因,还可对其功能机制进行分类,例如包括药物外排泵、酶解修饰、靶点修饰等多种耐药类型。此外,RGI 还提供对抗性基因所对应的抗生素类别、耐药表型及相关突变的具体注释信息,显著提升了其在临床病原体监测、环境抗性组研究及公共卫生安全评估中的实用价值。
二、零基础做生信
唯那生物推出的生信云平台服务(https://cloud.mimazi.net)提供了CARD-RGI耐药基因预测小工具,可以快速获取耐药基因预测结果(表格形式)。
您仅需微信扫码注册一个账号,找到免费小工具“RGI 预测核酸/蛋白质序列注释(耐药基因)”,提交对应文件,就能快速预测并下载结果。
小工具地址:
RGI预测核酸/蛋白质序列注释(耐药基因) :
https://cloud.mimazi.net/tool/article-107.html
三、RGI耐药基因预测小工具的使用方法
输入文件:
基因组预组装结果/核酸序列文件/蛋白序列文件(FASTA格式)
文件名禁止包含空格(如:EC Strain1.fasta ,可将其修改为 EC_Strain1.fasta)
rgi_contig/protein.txt:耐药基因注释结果
ORF_ID:检测到的 ORF(开放阅读框)编号;Start 和 Stop:起始和终止位置(若有);
Orientation:ORF 链方向:+(正链) / -(负链);
Cut_Off:筛选阈值策略:Strict(严格) / Perfect(完全匹配);
Pass_Bitscore:ORF 通过预测模型的 bitscore 值(衡量匹配质量);
Best_Hit_Bitscore:最佳匹配的参考序列 bitscore 值;
Best_Hit_ARO:最佳匹配的 CARD 参考基因名称(ARO 标识;
Best_Identities:与最佳参考序列的氨基酸相似度(%);
ARO:匹配的 ARO 编号(CARD 唯一标识);
Model_type:预测模型类型(如:蛋白同源模型);
SNPs_in_Best_Hit_ARO:相对于最佳参考序列的 SNP 数量(n/a表示无数据);
Other_SNPs:其他 SNP 信息(n/a表示无数据);
Drug Class:耐药药物类别(多个以 ;分隔);
Resistance Mechanism:耐药机制;
AMR Gene Family:耐药基因家族;
Predicted_DNA:ORF 的预测 DNA 序列;
Predicted_Protein:ORF 的预测蛋白质序列;
CARD_Protein_Sequence:CARD 参考数据库中匹配的蛋白质序列;
Percentage Length of Reference Sequence:预测蛋白与参考蛋白的长度百分比(覆盖度);
ID:唯一标识符;
Model_ID:预测模型 ID;
Nudged:未修正为完整 ORF 的标记(默认为空或 0);
Note:备息;
Hit_Start/ Hit_End:匹配在参考序列上的起止位置;
Antibiotic:抵抗的具体抗生素(多个以 ;分隔)
软件版本:Resistance Gene Identifier - 6.0.4
参考文献:
Alcock et al. 2023. CARD 2023: expanded curation, support for machine learning, and resistome prediction at the Comprehensive Antibiotic Resistance Database. Nucleic Acids Research, 51, D690-D699
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-9-14 02:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社