张左兵
小程序:用序列号实现从NCBI或Ensembl 批量下载序列
2021-11-9 09:18
阅读:6947

    构建进化树的时候,常需要批量下载序列,尤其是重现文献上进化树时。为此,利用python语言写了2个小程序,能够实现从NCBI的GenBank和Ensembl批量下载核酸序列和蛋白序列。

     分为2个版本:一个能够从ncbi批量下载,另一个能够从ensembl批量下载。

           

            小程序存贮在百度网盘:               

                      链接:https://pan.baidu.com/s/1x8wGvbi14GjNm-nkBotL6A 

                      提取码:gk1l

使用说明: 1. 将此exe文件放在任一文件夹中,双击后根据提示操作即可。

                  2. 序列号需要存储在txt文件中,每个序列号单独一行。

                  3. 每一行除序列号外,不要有的其它符号。

                  4. 如果从ncbi中下载,核酸序列号和蛋白序列号不能混合在一个txt文件中。

                  5. 如果从ensembl中下载,不区分核酸序列号和蛋白序列号,可以放在同一个txt文件中。

                  6. ensembl序列号和ncbi的序列号不能混合在同一个txt文件中。

               

     

注意事项:

                1. 本程序仅适用于win10操作系统。

                2. 结果以fasta格式形式存储在同一个文件夹的txt文件中,请根据提示查看。

致谢:

        1. python 社区(https://www.python.org/)。

        2. Biopython、colorama软件包的开发者、维护团队及资助者。


P.S. 如果有网友知道如何通过序列号判断蛋白和核酸序列,还望告知,以方便改进程序。


转载本文请联系原作者获取授权,同时请注明本文来自张左兵科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3446543-1311603.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论4 条评论
确定删除指定的回复吗?
确定删除本博文吗?