zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

piRAT:piRNA注释、分析和可视化工具

已有 768 次阅读 2025-8-23 12:18 |个人分类:科普|系统分类:科普集锦

piRATpiRNA注释、分析和可视化工具 

PiRNAPiwi 相互作用 RNA)是一类小非编码 RNA,通常长度为 26-33核苷酸。因物种而异,最早在 21 世纪初被识别。与其他小 RNA 类似,如 micro RNAmiRNA)和小干扰 RNAsmall interfering RNAs),piRNA Argonaute 家族蛋白结合,这些蛋白介导了它们之间的相互作用,调控靶标的转录或转录后表达水平。正如其名称那样,它们与一个属于 Argonaute 家族分支的PIWI 蛋白结合。 

最初,piRNA 在果蝇的生殖细胞中被发现,随后在生殖腺中被发现。其他动物中,它们被证明会靶向转座元件,这一作用让它们后来被称为基因组守护者。然而,近期研究表明,piRNA 在性腺以及许多动物物种的非性腺体细胞组织中也大量表达。这些发现使研究重点扩展到piRNA 在生殖细胞外的功能。事实上,piRNA 已被发现参与多种生物过程中,包括家蚕的性别决定,多种人类癌症,以及早期胚胎发育。 

尽管它们发挥着重要作用,但用于稳健注释的工具是研究 piRNA 的关键步骤。 用于非模式生物的研究,这些生物之前没有小 RNA 注释,包括piRNA 注释和 piRNA 数据库存在。最近,Robak等人介绍了 piRAT(图1https://github.com/ylla-lab/piRAT),一个用于注释、分析和可视化piRNA 的注释工具。一个利用与参考基因组对齐的小 RNA 测序数据来注释 piRNA 的工具。基于piRNA 生物合成信息,从主要和次要通路中提取适用于模式和非模式生物的piRNA区域。 

image.png

1 piRAT 流程图。A) 从映射到参考基因组的小RNA-seq 数据集开始,piRAT 首先通过每个位点选择一个代表性读数来清理数据。B) 然后确定数据集中的 piRNA 长度(如果用户未提供),接着进行 C) 使用特征性 ping-pong 签名进行 ping-pong 位点的注释,以及 D) 使用调优版本的 DBSCAN 进行 piRNA 簇的聚类,随后进行簇分类步骤。最后,E) piRAT 生成最终广泛的图形输出 

piRAT 解决了现有 piRNA 注释工具的局限性,并提供多种新功能,包括全面的图形输出,可直观地支持注释。因此,piRAT 在以下方面脱颖而出:a) 从生物合成中识别 piRNA 在一个运行中分析多种通路,b) 接受多个标准二进制比对文件(BAM)任意大小(限制由硬件能力决定),c) 无需特殊预处理步骤或需要外部数据库或注释), d) 生成图形支持注释的输出结果,并提供整体描述性统计数据。piRAT 提供了一套全面的功能,利用标准输入和输出文件。piRAT支持多种数据格式,并且无需任何类型的基因组注释。此外,piRAT 也比现有工具产生更高质量的 piRNA 注释。 

参考文献

[1] Dominik Robak, Guillem Ylla. piRAT: piRNA Annotation Tool for annotating, analyzing, and visualizing piRNAs, bioRxiv 2025.07.29.667427; doi: https://doi.org/10.1101/2025.07.29.667427 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://wap.sciencenet.cn/blog-571917-1498808.html

上一篇:PPMS:从单细胞数据中推断pri-miRNA表达谱框架
下一篇:揭示癌症串扰:跨越时空的复杂性
收藏 IP: 39.128.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-8-26 03:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部