hayidahubei的个人博客分享 http://blog.sciencenet.cn/u/hayidahubei

博文

sam文件小知识:正负链reads在sam文件中的序列信息

已有 7150 次阅读 2020-3-10 06:16 |个人分类:RNA_seq处理|系统分类:科研笔记| 二代测序, sam, 正负链

Sam文件的第二列:

FLAG:0正链,16负链,4没比对上


如果一个read mapping到正链上,sam文件第十列所展示的是这个read的序列。而如果一个read mapping到负链上,sam文件第十列所展示的是这个read的反向互补序列。


下面展示的是sam文件的两行(前10列):

K00315:238:HF3Y3BBXY:2:1211:29031:44728 0 chr10 360997 42 50M * 0 0 TGGTTGGAAGCTGGGGCCCCGGGGCAGGGGACGTCTGCTAAGCTGCGTAT

K00315:238:HF3Y3BBXY:2:2215:31142:22221 16 chr10 361681 40 50M * 0 0 CCATTATAAATCTTCATACTACAGAAACAGCCTGGGCAGAGCAACTGCCT


第一行第二列值为0, 意味着这行的read mapping到基因组的正链上。直接在原始fastq中搜索序列“TGGTTGGAAGCTGGGGCCCCGGGGCAGGGGACGTCTGCTAAGCTGCGTAT”,可以找到这个read


第二行第二列值为16, 意味着这行的read mapping到基因组的负链上。直接在原始fastq中搜索序列“CCATTATAAATCTTCATACTACAGAAACAGCCTGGGCAGAGCAACTGCCT”,找不到这个read. 它反向互补序列“AGGCAGTTGCTCTGCCCAGGCTGTTTCTGTAGTATGAAGATTTATAATGG”可以在原始fastq文件中被搜索到。





https://blog.sciencenet.cn/blog-1113671-1222669.html

上一篇:0_based and 1_based (Sam file, Bam file and Bed file)
收藏 IP: 130.91.194.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 06:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部