fawnshao的个人博客分享 http://blog.sciencenet.cn/u/fawnshao

博文

随机取fastq序列

已有 3685 次阅读 2013-1-10 12:55 |个人分类:基因组工具|系统分类:科研笔记| 随机, fastq

有时候为了看看测序深度对结果有什么影响,需要人为取原始序列的subset来分析下。
看到http://www.biostars.org/p/6544/ 这个讨论很好,随手记录下。
ShortReader的FastqSampler还算比较简单,序列较多的时候要很大内存。
我第一次在pc机上跑的时候发现一直没结果,但cpu一直在小量运行中,后来挪去大内存的server上很快就出来了。
今天发现awk结合shuf命令很简单。pc机上装的Ubuntu自带shuf命令,但是server上装的Centos没有。


https://blog.sciencenet.cn/blog-824692-651664.html

上一篇:基因组坐标
下一篇:linux 下copy file 总是问要不要overwrite怎么办
收藏 IP: 158.182.150.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 04:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部