zbzhang的个人博客分享 http://blog.sciencenet.cn/u/zbzhang

博文

生物信息小软件:在线BLAST(可批量)

已有 3561 次阅读 2023-1-23 19:03 |个人分类:生物信息|系统分类:科研笔记

    有的时候,我们需要在线blast多个序列,如果逐个的往NCBI blast页面输入,比较繁琐,也比较费时。为此,利用python语言特编写了一个小程序,以方便使用。软件分2个版本:(1)版本一(blast_online2htmlV1.0.exe)是将blast结果以html形式存储,并将比对上的前5个序列信息提取到excel文件中;(2)版本二(blast_online2xmlV1.0.exe)将blast结果以xml形式和tab形式存储,,并将比对上的前5个序列信息提取到excel文件中。如果您习惯于NCBI blast结果传统的界面,建议使用版本一。


下载地址:

            链接:https://pan.baidu.com/s/1jKv3GC7-eOjBUbkPiOyozQ 

            提取码:3rol

使用说明:

        1. 拟比对的序列以fasta格式的形式存储在记事本(.txt)文件中。

        2. 将此.exe文件和上述的.txt文件放在任一文件夹中,双击后根据提示操作即可。

        3. 如果是blast_online2htmlV1.0.exe,运行的html请在output_html_*(*为比对的txt文件名)文件夹内查找,每个序列生成一个单独的html文件,前5个序列的统计结果直接在本文件下的blast_results_html_all.xlsx文件中。

        4. 如果是blast_online2xmlV1.0.exe,运行的xml请在output_xml_*(*为比对的txt文件名)文件夹内查找,每个序列生成一个单独的xml文件;运行的tab请在output_tab_*(*为比对的txt文件名)文件夹内查找,每个序列生成一个单独的tab文件;前5个序列的统计结果直接在本文件下的blast_results_xml_all.xlsx文件中。

        5.可实现blastn、blastp、blastx、tblastn和tblastx五种方法;目前可比对的核酸数据库有:nt、est、wgs、refseq_representative_genomes和refseq_rna;目前可比对的蛋白数据库有:nr、wissprot、pdb、env_nr和tsa_nr,如果特殊需求,请联系我。


注意事项:

    1. 本程序仅适用于win10、win11操作系统。

    2. 比对的序列尽量不要超过50个;如果比对的序列更多,建议使用本地blast,具体可参考前面发表的生物信息小软件:本地BLAST

    3. 如果有一定数量的序列,尽量在美国东部时间晚上九点——早上5点之间,或者周末。美国东部时间夏令时比北京时间晚13个小时(3月的第2个周日开始到11月的第1个周日结束),非夏令时比北京时间晚12小时,大致来讲,大陆的同学尽量不要在下班时间使用本小程序。

    4. 每次运行程序(连接服务器)需要间隔10秒以上。

    5. 不要把相同的序列在1分钟内提交2次及以上(即:提交fasta格式的序列尽量不要有既重名又相同的序列),要间隔至少1分钟以上。

致谢:

        1. python 社区(https://www.python.org/)。

        2. Biopython、CSV、 openpyxl、BeautifulSoup和colorama软件包的开发者、维护团队及资助者。




https://blog.sciencenet.cn/blog-3446543-1373161.html

上一篇:小程序:从fasta序列中挑选出特定fasta序列
收藏 IP: 183.191.42.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-4 19:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部