vesperlight的个人博客分享 http://blog.sciencenet.cn/u/vesperlight

博文

宏基因组分析(2):拼接及评价(SPAdes+QUAST)

已有 13415 次阅读 2017-11-16 13:08 |个人分类:生信|系统分类:科研笔记| Assembly, 拼接, 宏基因组, SPAdes

2.1 拼接

工具:SPAdes

网址:http://cab.spbu.ru/software/spades/

引用:Bankevich A., Nurk S., Antipov D., GurevichA., Dvorkin M., Kulikov A. S., Lesin V., Nikolenko S., PhamS., Prjibelski A., Pyshkin A., Sirotkin A., Vyahhi N.,Tesler G., Alekseyev M. A., Pevzner P. A. SPAdes: A New Genome AssemblyAlgorithm and Its Applications to Single-Cell Sequencing. Journal ofComputational Biology,2012

2.1.1简介

SPAdes是由俄罗斯科学院圣彼得堡理工大学(St. PetersburgAcademic University of the Russian Academy of Sciences)计算生物学实验室开发的基因组拼接工具。主要用于二代(宏)基因组、(宏)转录组测序的拼接,也可用于一、二、三代测序的混合组装。是目前评价最好的拼接工具之一。

2.1.2 安装

wgethttp://cab.spbu.ru/files/release3.11.1/SPAdes-3.11.1-Linux.tar.gz

tar -xzf SPAdes-3.11.1-Linux.tar.gz

cd SPAdes-3.11.1-Linux/bin/

2.1.3使用方法

Python /home/sam/software/SPAdes-3.11.1-Linux/bin/SPAdes.py--meta -k 21,33,55,77,99,127 -1 L1.fq -2 L2.fq -o spa_out/

--meta           宏基因组拼接模式

-k           k-mer值对于测序深度高的宏基因组数据(50x+ 2*150bpk-mer可设为 21,33,552*250bp可设为–k 21,33,55,77,99,127

-1                  双端测序的一端序列

-2                  双端测序的另一端序列

-o                  输出文件夹

Ps.服务器(100G RAM 16proc*2.67GHz)上(20G数据量,PE-150策略)拼接时间约12~16小时

2.2 拼接评估

工具:QUAST

网址:http://quast.bioinf.spbau.ru/

引用:

2.1.1简介

QUAST用于基因组和宏基因组的拼接评估

2.1.2 安装

wget https://downloads.sourceforge.net/project/quast/quast-4.6.0.tar.gz

tar -xzf quast-4.6.0.tar.gz

cd quast-4.6.0

sudo python setup.pyinstall_full

2.1.3使用方法

python/home/sam/software/quast-4.6.0/quast.py contigs.fasta -o res





https://blog.sciencenet.cn/blog-2379401-1085489.html

上一篇:宏基因组分析流程(1):质控
下一篇:无法将grub-efi-amd64-signed软件包安装到/target中的问题解决
收藏 IP: 223.85.248.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 08:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部