|
新的一年,,对于许多热爱学习的小伙伴来说,又是一个默默成长然后在春天惊艳所有人的绝佳机会。而我们的工作就是成就你的愿望。
近期小编会陆续为大家带来一系列总结性的材料,希望对大家有用。还没关注小编的赶紧点击上方【密码子实验室】关注哦。
今天为大家带来第二份礼!(往期内容)
想要学习细菌基因组分析的小伙伴赶紧看过来。
细菌基因组分析最基础、最核心的部分是获得完整准确的组装序列(包括染色体和质粒),其次进行组分分析,即通常所说的基因注释、移动元件分析等,接下来可以根据研究目的选择方法进行比较基因组研究,最后挖掘并关联结果,解答科学问题,当然,过程中可能会涉及到实验或其他组学方法。下面给大家整理了各分析模块所需的软件、数据库,记得收藏哦。
1、序列质控
FastQC
用途:对Fastq文件的测序质量进行统计
优点:既可图形化界面运行,又可命令行运行
下载地址:http://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Seqprep
用途:去序列接头
缺点:需要配置接头序列
下载地址:https://github.com/jstjohn/SeqPrep
Sickle
用途:测序质量剪切
下载地址:https://github.com/najoshi/sickle
Smrtanalysis
用途:三代数据质控
下载地址:
https://s3.amazonaws.com/files.pacb.com/software/smrtanalysis/2.3.0/smrtanalysis_2.3.0.140936.run
Trimmomatic
用途:用于数据质控
下载地址:http://www.usadellab.org/cms/index.php?page=trimmomatic
2、基因组组装
Celera Assembler
用途:对组装结果进行序列成环判断、基因组序列及质粒序列区分
下载地址:http://sourceforge.net/projects/wgs-assembler/files/wgs-assembler/wgs-8.3/
Flye
用途:ONT真菌精细图组装
优点:组装效果很好,准确可靠
下载地址:https://github.com/fenderglass/Flye
GapCloser
用途:二代组装结果中gap区域的填补
GATK
下载地址:https://software.broadinstitute.org/gatk/
HGAP
用途:用于三代测序数据组装
proovread2.12
用途:对组装结果进行序列成环判断、基因组序列及质粒序列区分
下载地址:https://github.com/BioInf-Wuerzburg/proovread
SMRT Analysis
用途:对组装结果进行序列成环判断、基因组序列及质粒序列区分
下载地址:https://github.com/PacificBiosciences/SMRT-Analysis/wiki/SMRT-Pipe-Reference-Guidev2.3.0
Unicycler
用途:ONT细菌完成图组装软件
优点:二+三混合组装,组装效果很好,准确可靠
下载地址:https://github.com/PacificBiosciences/SMRT-Analysis/wiki/SMRT-Pipe-Reference-Guidev2.3.0
用途:用于二代测序数据组装
下载地址:https://www.ebi.ac.uk/~zerbino/velvet/
3、基因组质量评估
BUSCO
用途:评价基因组组装质量
CheckM
用途:bins质量评估/基因组组装质量评估
下载地址:https://github.com/Ecogenomics/CheckM QUAST
用途:QUAST可直接统计fasta文件中的序列长度、GC含量、N50等指标,提供组装结果的基本信息。若在评估时额外输入另一个已存在的参考基因组,这时除了统计基本指标外,还会将组装结果与参考序列进行比较,包括长度、GC含量、对齐程度等,为基因组的组装质量评估提供更多的参考内容
下载地址:http://quast.bioinf.spbau.ru/
Bwa
用途:二代矫正
4、基因组组分分析
Augustus
用途:真菌基因预测
优点:从头预测,能够侦测在序列数据库中缺少同源片段的编码区
下载地址:http://augustus.gobics.de/
Barrnap
用途:rRNA预测
下载地址:https://github.com/tseemann/barrnap/archive/0.8.tar.gz
BLAST+
用途:多类数据库注释比较分析等
局限性:速度慢
下载地址:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.3.0/ncbi-blast-2.3.0+-x64-linux.tar.gz
Blast2go
用途:GO注释
局限性:依赖于mysql和NR注释
CGView
用途:圈图绘制
下载地址:http://wishart.biology.ualberta.ca/cgview/download.html Circos
Circos
用途:圈图绘制
CRISPRFinder
用途:预测crispr
地址:http://aclame.ulb.ac.be/Tools/Prophinder/ Cufflinks
用途:真菌基因预测
优点:基于转录组预测,辅助预测
下载地址:https://www.plob.org/tag/cufflinks/ Diamond
用途:多类数据库注释比较分析等
优点:速度快,将预测基因的蛋白序列与各功能数据库进行Diamond 比对
下载地址:https://github.com/bbuchfink/diamond/releases/download/v0.8.35/diamond-linux64.tar.gz
Genewise
用途:真菌基因预测
优点:同源预测,预测同源片段的编码基因
下载地址:https://www.ebi.ac.uk/Tools/psa/genewise/ Infernal
用途:RNA注释
Islander
用途:基因组岛预测
下载地址:https://bioinformatics.sandia.gov/islander/download.html IslandPath-DIMOB
用途:基因组岛预测
下载地址:http://www.pathogenomics.sfu.ca/islandviewer/ Minced
用途:CRISPR-Cas系统预测
下载地址:https://sourceforge.net/projects/minced/
Phage_Finder
用途:前噬菌体预测
下载地址:http://phage-finder.sourceforge.net/
PHAST
用途:预测前噬菌体
下载地址:http://phast.wishartlab.com/ Prokka
用途:基因预测
下载地址:https://github.com/tseemann/prokka PromPredict
用途:启动子预测
下载地址:http://nucleix.mbu.iisc.ernet.in/prompredict/download.html
RepeatMasker
用途:散在重复序列预测
Rfam cmsearch
用途:sRNA 预测
Tandem Repeats Finder
用途:串联重复序列预测
下载地址:http://tandem.bu.edu/trf/trf.html
Tmhmm
用途:跨膜蛋白预测
下载地址:http://www.cbs.dtu.dk/services/software.php TRF
用途:串联重复序列分析
下载地址:https://tandem.bu.edu/trf/trf.download.html antiSMASH
用途:次级代谢产物合成基因簇分析
下载地址:https://dl.secondarymetabolites.org/releases/4.0.2/antismash-4.0.2.tar.gz HMMER
用途:蛋白结构比对分析
下载地址:http://eddylab.org/software/hmmer/hmmer-3.1b2.tar.gz SignalP
用途:分泌蛋白预测
下载地址:http://www.cbs.dtu.dk/cgi-bin/sw_request?signalp+4.1
【未完待续】
猜你喜欢
SnapGene viewer
微生物基因组公开课回放
1.细菌基因组测序方式:重测序、扫描图、完成图、转录组如何选择
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-27 21:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社