熊朝亮
测序分析中常用文本格式之间的转换
2014-11-29 23:43
阅读:8892

1.gtfBed的互相转换, 两者都是基因注释文件,gtf的一行表示一个exon,多行表示一个基因。而bed的一行表示一个基因。
$ perl gtf2Bed.pl $gtfFile >$bedFile
$ sh bedToGtf.sh $bedFile >$gtfFile

gtf2Bed.pl

bedToGtf.sh


2.利用bed从基因组上取fasta
$twoBitToFa -bed=$bedFile $genome.2bit $fastaFile
补充:fasta转成2bit

$ faToTwoBit in.fa out.2bit


3.bam转成bedgraph  

bedgrahp可以对bam文件进行可视化的查看,写论文时经常要截图
$ genomeCoverageBed -bg -ibam $bamFile -g $genome.sizes > $bedgraphFile

4.sam与bam的互转
bam-->sam:
$ samtools view -h -o $out.sam $in.bam
sam-->bam:
$ samtools view -bS in.sam >out.bam


5.Usage:   fq_all2std.pl command in.txt

Command: scarf2std      Convert SCARF format to the standard/Sanger FASTQ
        fqint2std      Convert FASTQ-int format to the standard/Sanger FASTQ
        sol2std        Convert Solexa/Illumina FASTQ to the standard FASTQ
        fa2std         Convert FASTA to the standard FASTQ
        fq2fa          Convert various FASTQ-like format to FASTA
        instruction    Explanation to different format
        example        Show examples of various formats

fq_all2std.rar


转载本文请联系原作者获取授权,同时请注明本文来自熊朝亮科学网博客。

链接地址:https://wap.sciencenet.cn/blog-1509670-847310.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?