科学网

 找回密码
  注册
md5的使用
熊朝亮 2015-9-6 16:26
测序完成之后,测序公司将数据返还给客户,除了fastq文件外,还有一个md5文件。那么,问题来了,这个md5究竟是个什么鬼? 下面是来自百度的关于md5的解释: “ MD5即Message-Digest Algorithm 5(信息-摘要算法5),用于确保信息传输完整一致。是计算机广泛使用的杂凑算法之一(又译摘要算法、哈希算法),主流编程语 ...
个人分类: 【技术-脚本】|2658 次阅读|没有评论
如何去除测序数据中的接头和低质量的reads?
热度 4 熊朝亮 2015-8-20 10:48
高通量测序数据下机后得到了fastq的raw_data,通常测序公司在将数据返还给客户之前会做“clean”处理,即得到clean_data。然而,这些 clean_data是否真的“clean”呢? 首先,我们应该做一下质控。如果质控不合格,就需要一些处理,比如去接头、去除量的reads。 (1)去除测序数据中的接头(用到的是fastx_toolkit里面 ...
个人分类: 【技术-脚本】|44285 次阅读|8 个评论 热度 4
shell: 统计当前目录下文件数/文件夹数
熊朝亮 2014-12-10 14:40
Linux下查看当前目录下文件的个数 ls -l | grep “^-” | wc -l 查看当前目录下文件的个数,包括子目录里的 ls -lR| grep “^-” | wc -l 查看某目录下文件夹(目录)的个数,包括子目录里的。 ls -lR| grep “^d” | wc -l 简要说明: ls -l 长列表输出该目录下文件信息(注 ...
个人分类: 【技术-脚本】|4316 次阅读|没有评论

本页有 7 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-15 04:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部