有时候为了看看测序深度对结果有什么影响,需要人为取原始序列的subset来分析下。
看到http://www.biostars.org/p/6544/ 这个讨论很好,随手记录下。
ShortReader的FastqSampler还算比较简单,序列较多的时候要很大内存。
我第一次在pc机上跑的时候发现一直没结果,但cpu一直在小量运行中,后来挪去大内存的server上很快就出来了。
今天发现awk结合shuf命令很简单。pc机上装的Ubuntu自带shuf命令,但是server上装的Centos没有。
https://wap.sciencenet.cn/blog-824692-651664.html
上一篇:
基因组坐标下一篇:
linux 下copy file 总是问要不要overwrite怎么办