nsaa001的个人博客分享 http://blog.sciencenet.cn/u/nsaa001

博文

你的实验室该买哪种测序仪? 精选

已有 16401 次阅读 2014-2-13 06:30 |系统分类:科研笔记

从2006年沃森(和他老板Craig)的全基因序列作为第一个人类的全基因组序列被测出,到现在已有上千个人的基因组在网上公布了,现今的测序技术比77年的第一代测序技术Sanger法先进了不少,价格也下降到1000美元/人的基因组。我用图片介绍几个实验室常用的测序仪的各种优缺点,机器都来自赫尔辛基大学测序中心,我是用手机拍的,不大清楚,就将就看吧:D


这台是最经典款,454 life sciencesGS FLX+,罗氏在07年收购了454以后机器上就多了罗氏的商标。这台机器在官网介绍的平均读长为793bp,最长可以到1000pb,在23小时内可以读出78亿个碱基对。GS FLX+用的是相当经典的emusion PCR技术,不过经典也注定得被后来的淘汰。实际上,现在已经没有实验室买454了,因为它读取速度慢,通量太小,测序也费要用比其他机器高上好几十倍。这台机器在官网没有报价,貌似要11万美元左右,在国内到底卖多少钱就不知道了。454作为世界上第一台商业化的二代测序仪,现在也快要退出市场了,罗氏宣布在2016年正式关闭454测序的业务。


 


这台是Illumina的MiSeq,这台机器两天时间内可以读出80亿个碱基对,这要比刚才的GS FLX+快上七八倍,Miseq读长没有454的长,只有250bp左右,属于中等。它的测序技术也叫PCR,但是跟454的不同,它为了增强信号,在平板上孵育到一定密度才会开始测序,因此精确度比较高,这种技术是他们的专利(也很经典)。Miseq一般比较受中小型实验室的青睐,因为一台miseq售价大约在十万美元,测序表现也相当不错,容易被中小型实验室接受。

Illumina现在无疑是测序界的领头羊,2011年就卖掉了上千台HiSeq系列,2010年华大一次性从illumina购买了128HiSeq 2000,变成illumina最大的客户。代价虽大,不过看他们每年发的nataurescience,就知道这些钱肯定花在了刀刃上。

 


这个是Life Technologysolid 5500平台,这个读长最短,跟HiSeq 2000一样,只有不到一百(实际上只能到35-50bp),这是它的短板。牺牲读长换取速度带来的是所需的测序工作增加(读长短可信度降低,就要使测序深度增加),后期组装计算量也会成倍增长,虽然有些算法可以弥补读长短的问题,但降低计算量的同时也会降低精确度,如果遇到大量的重复区段就更不容易组装。实际上如果基因组已知的话,读段小点也没关系,如果是测一个新物种,读段小的劣势就很明显了。

Solid 5500平均一天能读出200-300亿的碱基对,速度不比miseq慢。它也用到emPCR的技术,但是后来的读取方式有些不同,它用四种颜料来代表十六种碱基对排列,在合成的同时每两个两个碱基对来读取,不仅非常炫,而且也有利于提高测序的精确度,貌似这种方式在验证单核苷酸多态性的时候会很占优势。


 


这个是pacific biosciencepacbio,它用的是一种叫做SMRT的技术,不需要PCR就能测序。SMAT读起来像smart,它也确实smart,因为他的读长可以到好几千个碱基(最长可以到5000个碱基)。虽然不是现有测序仪里最长的,但也进步了很多。它的缺点是精确度没有MiSeq高,一次测序的准确度在90%以下,这也需要用更深的coverage来解决,当深度达到20倍的时候精确度就会提升到99.999%pacbio有个好处是在测序的同时可以检测被修饰过的碱基,比如说CpG中的胞嘧啶甲基化。以前大家测甲基化位点时,用化学方法将甲基化的位点变为其他碱基,然后再把突变后的序列拿来重新测一遍,跟之前的对比,但这种技术只能用来检测五位甲基化的胞嘧啶(5-mC)。现在pacbio可以在测序同时检测所有的甲基化修饰。简单化的原理是,在机器监测下的DNA复制过程中,当下一个互补碱基要配对时,母链上甲基化的位点会使配对的时间延长,这样就会形成一个可以被检测到的时间小空当。下面这个图是从官方说明书里截的,中间那一段就代表一个甲基化信号。pacbio售价昂贵,一台需要70万美元,而且运行起来也比其他测序仪烧钱得多,但独特的优势也是其他测序仪比不了的。

 

 

可惜我这里没有ion torrent的照片,ion torren系列是现在最有潜力的测序系列,华大去年买了ion torrent 系列的50Ion Proton I,这个系列里最推荐的要属PGM,轻便小巧,价格算很低的,每次运行时间只需要两个小时,虽然读长也短(200bp),但是比起HiSeqSolid也长得多了,我估计PGM在现在和将来都会是很多实验室的首选(我不是在做广告—_—)。

BGI收购的complete genomics,Qiangen,还有罗氏跟IBM,都在努力开发新的测序平台,好像读段会变得很长(能提高的空间估计也只是读长了)

如果对详细的数据感兴趣,可以读一下2012年Quail MA和同伴们发表的comparason of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers,这三种也是目前最主流的三种了。

 




https://blog.sciencenet.cn/blog-635619-767024.html

上一篇:C值悖论是由进化造成的吗?
下一篇:热带雨林离我们有多远
收藏 IP: 130.231.237.*| 热度|

13 余国志 张叔勇 高大海 程起群 赵凤光 查宏光 苏红 熊李虎 苏光松 idealist ZFRI biofans rosejump

该博文允许注册用户评论 请点击登录 评论 (15 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 04:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部