||
有的时候,我们需要在线blast多个序列,如果逐个的往NCBI blast页面输入,比较繁琐,也比较费时。为此,利用python语言特编写了一个小程序,以方便使用。软件分2个版本:(1)版本一(blast_online2htmlV1.0.exe)是将blast结果以html形式存储,并将比对上的前5个序列信息提取到excel文件中;(2)版本二(blast_online2xmlV1.0.exe)是将blast结果以xml形式和tab形式存储,,并将比对上的前5个序列信息提取到excel文件中。如果您习惯于NCBI blast结果传统的界面,建议使用版本一。
下载地址:
链接:https://pan.baidu.com/s/1jKv3GC7-eOjBUbkPiOyozQ
提取码:3rol
使用说明:
1. 拟比对的序列以fasta格式的形式存储在记事本(.txt)文件中。
2. 将此.exe文件和上述的.txt文件放在任一文件夹中,双击后根据提示操作即可。
3. 如果是blast_online2htmlV1.0.exe,运行的html请在output_html_*(*为比对的txt文件名)文件夹内查找,每个序列生成一个单独的html文件,前5个序列的统计结果直接在本文件下的blast_results_html_all.xlsx文件中。
4. 如果是blast_online2xmlV1.0.exe,运行的xml请在output_xml_*(*为比对的txt文件名)文件夹内查找,每个序列生成一个单独的xml文件;运行的tab请在output_tab_*(*为比对的txt文件名)文件夹内查找,每个序列生成一个单独的tab文件;前5个序列的统计结果直接在本文件下的blast_results_xml_all.xlsx文件中。
5.可实现blastn、blastp、blastx、tblastn和tblastx五种方法;目前可比对的核酸数据库有:nt、est、wgs、refseq_representative_genomes和refseq_rna;目前可比对的蛋白数据库有:nr、wissprot、pdb、env_nr和tsa_nr,如果特殊需求,请联系我。
注意事项:
1. 本程序仅适用于win10、win11操作系统。
2. 比对的序列尽量不要超过50个;如果比对的序列更多,建议使用本地blast,具体可参考前面发表的生物信息小软件:本地BLAST。
3. 如果有一定数量的序列,尽量在美国东部时间晚上九点——早上5点之间,或者周末。美国东部时间夏令时比北京时间晚13个小时(3月的第2个周日开始到11月的第1个周日结束),非夏令时比北京时间晚12小时,大致来讲,大陆的同学尽量不要在下班时间使用本小程序。
4. 每次运行程序(连接服务器)需要间隔10秒以上。
5. 不要把相同的序列在1分钟内提交2次及以上(即:提交fasta格式的序列尽量不要有既重名又相同的序列),要间隔至少1分钟以上。
致谢:
1. python 社区(https://www.python.org/)。
2. Biopython、CSV、 openpyxl、BeautifulSoup和colorama软件包的开发者、维护团队及资助者。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-4 19:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社