科学网

 找回密码
  注册
宏基因组/转录组去除宿主污染
涂波 2021-1-23 00:41
对于宿主(动植物)来源的宏基因组、(宏)转录组,去除宿主序列污染对于序列拼接等分析的准确定至关重要,我们可以通过将raw reads或初步质控后的clean reads与宿主的基因组序列进行多重比对,提取其中未比对上的序列,就可以获得去除了宿主序列的reads。 由于做人体微生物的比较多,所以这里以人宿主污染为例。 ...
个人分类: 生信|7907 次阅读|没有评论
使用Aspera批量下载GeneBank和EMBL数据库数据
涂波 2021-1-21 21:13
如果想下载GeneBank和EMBL的数据有很多种方法,对于小量的数据我们可以用ftp下载工具或wget等工具直接下载,对于大的数据为了保证数据下载的速度和稳定性,建议最好使用Aspera进行下载。 Aspera成立于2004年,2013年被IBM收购。Aspera软件对于大数据的传递有很好的支持,在包括生命科学领域内的数 ...
个人分类: linux|6168 次阅读|没有评论
基于crontab的进程守护方法
涂波 2021-1-20 22:07
用aspera批量下载几个T的基因组数据的时候,由于网络问题经常会使得apsera超时中止。如果不超时时间设置太长又怕无限期卡死了,这两种情况如果没有及时发现事情又要耽误很久。好在aspera支持断点续传,所以在只需要实时监测aspera的运行情况,如果进程停了就重新开始。我的思路是写一个shell脚本用ps命令检测apsera的任务a ...
个人分类: linux|2520 次阅读|没有评论
Docker中的linux系统添加中文支持
涂波 2020-12-18 12:53
新 pull 的 ubuntu等linux系统 镜像如果不支持中文字符 ,会导致路径下的所有中文内容不能正常显示,所以需要配置中文字符集支持。其实这个方法对于直接安装的linux系统也是一样的道理。 1、首先查看查看当前系统中支持的字符集 创建一个 docker 容器 docker run -it ubuntu /bin/bash #不要加--rm ...
个人分类: linux|3918 次阅读|没有评论
无法将grub-efi-amd64-signed软件包安装到/target中的问题解决
涂波 2018-1-16 21:05
UEFI引导模式的ubuntu安装时报错“无法将grub-efi-amd64-signed软件包安装到/target中“的问题是一个bug。解决方式很简单,在安装时联网,勾选“安装时下载更新“即可。
个人分类: linux|22642 次阅读|没有评论
宏基因组分析(2):拼接及评价(SPAdes+QUAST)
涂波 2017-11-16 13:08
2.1 拼接 工具: SPAdes 网址: http://cab.spbu.ru/software/spades/ 引用: Bankevich A., Nurk S., Antipov D., GurevichA., Dvorkin M., Kulikov A. S., Lesin V., Nikolenko S., PhamS., Prjibelski A., Pyshkin A., Sirotkin A., Vyahhi N.,Tesler G., Alekseyev M. A., Pevzner P. A. SPAdes: A ...
个人分类: 生信|13435 次阅读|没有评论
宏基因组分析流程(1):质控
涂波 2017-11-16 13:01
宏基因组分析的第一步是质量控制,主要包括adapter 和低质量序列的修剪与去除。 工具: Trimmomatic 网址: http://www.usadellab.org/cms/index.php?page=trimmomatic 引用: Bolger, A. M., Lohse, M., Usadel, B. (2014). Trimmomatic: Aflexible trimmer for Illumina Sequence Data. Bioinformatic ...
个人分类: 生信|10630 次阅读|没有评论
基因预测工具:Prodigal
涂波 2017-11-16 12:15
1 简介 p rodigal(Prokaryotic Dynamic Programming Genefinding Algorithm)用于原核微生物基因组和宏基因组的基因预测, 是 Oak Ridge National Laboratory 和 University of Tennessee-Knoxville 在2007年联合开发的。更多信息(https://github.com/hyattpd/Prodigal/wiki/introduction) 2下载及安装 代码托 ...
个人分类: 生信|19938 次阅读|没有评论
序列多重比对工具:MUSCLE
涂波 2017-8-15 09:27
Muscle MUSCLE是RC Edgar开发的序列多重比对(Multiple Sequence Alignment,MSA)工具 下载和相关说明地址为http://www.drive5.com/muscle/manual/ 1、比对并保存比对结果为Fasta格式文件 muscle -in seqs.fa -out seqs.afa 对于大数据集可以使用 muscle -in seqs.fa -out seqs.afa -max ...
个人分类: 生信|20055 次阅读|没有评论

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 20:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部