luria的个人博客分享 http://blog.sciencenet.cn/u/luria

博文

pybedtools filter bug 避坑

已有 1302 次阅读 2022-12-5 17:56 |个人分类:BioIT|系统分类:科研笔记

bedtools是使用率很高的生信工具,将其整合到python(pybedtools),可以方便的调用,这本来是一件很好的事,但是遗憾的是pybedtools还是很不成熟,存在一些bug,我遇到的一个filter bug如下:

 

>>> from pybedtools import BedTool

>>> sampleA = BedTool("sampleA_raw.bed")

>>> print(sampleA)

chr1     40130793        40131513

chr1     40261767        40262522

chr1     40273326        40274035

chr2     6744599          6745299

chr2     9114431          9115158

chr2     15428403        15429102

 

>>> sampleB = BedTool("sampleB_raw.bed")

>>> print(sampleB)

chr1     40260000        40270000

 

>>> print(sampleA.intersect(sampleB, wo=True))

chr1     40261767        40262522        chr1     40260000        40270000        755

 

>>> sampleA_chr1 = sampleA.filter(lambda x: x.chrom=="chr1")

>>> print(sampleA_chr1)

chr1     40130793        40131513

chr1     40261767        40262522

chr1     40273326        40274035

 

>>> print(sampleA_chr1.intersect(sampleB, wo=True))

 

>>> 

>>>

 

sampleA filter之后再与sampleBintersect时居然是空的!

出现这个bug后,我发现pybedtools官网上没有提供类似github Issues的入口,遇到bug无法反馈,这太糟糕了!

 

所以,尽量还是使用bedtools而非pybedtools




https://wap.sciencenet.cn/blog-2970729-1366658.html

上一篇:人类基因组hg19及其注释
下一篇:Compartment Saddle Plot分析细节
收藏 IP: 223.76.222.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 16:16

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部