luhongzhong的个人博客分享 http://blog.sciencenet.cn/u/luhongzhong

博文

超快速的原核生物基因组注释工具

已有 1793 次阅读 2021-10-5 06:37 |系统分类:科研笔记

随着肠道微生物组的兴起,大量的原核生物被测序。如何简单快速地进行基因组组装和注释分析呢?这里简单介绍一个新工具ZGA。

从下图可以看出,ZGA以原始的read数据作为输入,可以自动化地处理每一个过程,从质控分析、组装到最后的基因组注释。值得注意的是基因组组装和基因注释往往存在多种工具,因此可以根据需要尝试不同的方法。举例而言,在基因注释方面,目前常用的工具有Prokka,该工具几乎是微生物基因组分析的标配。而ZGA则采用的是一种较新的工具包DFAST,因此根据需要可以针对组装好的基因组再用Prokka重新注释一遍。ZGA的原始输入数据可以是单端测序、双端测序和混合测序类型,需要根据不同的数据类型调节参数。一旦参数设置好,后面的流程全自动化。

Screenshot 2021-10-04 at 20.17.26.png

图片引用自

https://www.biorxiv.org/content/10.1101/2021.04.27.441618v1.full


ZGA另外一个优势是它会自动存储每个步骤后的结果以及相应的代码流程。如果觉得有问题可以回过头来检测每个步骤出来的结果。需要注意的是,作者在使用的过程中,发现不同软件包出来的结果会有一些差异,如在最后一步基因数目会不一样。因此对于关键结论,作者推荐使用不同package进行基因组组装和注释以评估结果的可重复性。

基因组从头组装和注释其实步骤繁琐,有了ZGA让作者这种小白也能上手,大家不妨尝试一下。


鲁洪中 编
欢迎转发,如有侵权,敬请告知!




https://blog.sciencenet.cn/blog-573068-1306779.html


收藏 IP: 120.204.249.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-22 08:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部