raindyok的个人博客分享 http://blog.sciencenet.cn/u/raindyok

博文

正选择分析之 Branch site model 篇(By Raindy)

已有 28530 次阅读 2015-9-23 10:01 |个人分类:软件教程|系统分类:科研笔记| Model, site, EasyCodeML, PAML, Branch

絮语:
  
关于CodeML中的几种模型,这里就不科普了,推荐研读2015 年Nature Reviews Genetics这篇综述:
  Sironi M, Cagliani R, Forni D, Clerici M. Evolutionary insights into host-pathogen interactions from mammalian sequence data. Nature Reviews Genetics, 2015, 16: 224-236.
  当然也可以参阅这篇日志:PAML FAQ (http://user.qzone.qq.com/58001704/blog/1434533530)

  本例示范操作如何应用我们开发的EasyCodeML软件进行Branch site model 分析

准备工作
(1)计算机环境:Java 运行环境(JRE)
(2)相关
工具:EasyCodeML 、谷歌浏览器Chrome、DAMBE
(3)必备文件:比对文件(基于密码子比对,并删除终止密码子)、树文件(Newick格式,可以用Figtree导入导出进行格式化)

操作流程:
  1. 将比对后的序列进行转化,通过DAMBE打开,选择序列类型为编码蛋白质的核苷酸序列,如下图所示:


识别序列后,返回菜单栏选择“Sava or Convert Sequence Format”, 如下图所示:


文件类型选择为PAML,扩展为PML(如下图所示),保存后将扩展名改为nuc(当然这个非必须,不改也可以的)。


2. 标记前景枝
  打开EasyCodeML,分别定义工作目录(即:程序在哪个文件夹中运行)、选择已比对的序列文件(即:前一步得到的比对文件)、选择树文件。
  如果前景枝已经标记, 可以忽略下面这一步。
  本示例数据的树文件未标记前景枝,这里演示一下如何用EasyCodeML可视化标记前景枝。
  选择Newick的树文件后,点击“Label”标签(下图),程序会调用Chrome等插件来操作。


在待分析的分支上,点击一下,出现红色时,即表明前景枝已选定,此时只需要点击上方的“Finished”按钮完成前景枝标记。
  Raindy注:可视化标记是我们这款EasyCodeML的亮点之一。

完成后前景枝标记后,返回程序时,树文件已自动变更为标记好的Tree文件。
  此时可以开始后续操作,这里先选择Branch site model,然后“Save Current Profile”保存界面参数设置,最后“Run CodeML”分析,如下图所示:


在运行Codeml分析,程序会提示是否自动开始,“确定“之后就是细心的等待....


3. 似然率检验(LRTs)
  程序运行的时间取决于所分析的数据和计算机硬件配置。当完成后,会弹出完成的提示框。
”确定“后,程序自动将LRTs结果显示在主界面上,这里主要看P值,必须低于0.05,如下图所示:


4.结果整理
  当然,在LRT的P值显著情况下,您可以选择将运算结果以Excel 电子表格的形式呈现,相关参数直观显示在表格中。表格数据只需要简单整理即可用于发表用。

本示例结果显示,定义的前景枝中第100位氨基酸位点受到显著的正选择作用(后验概率PPs大于0.95)。

下图为部分SCI 文章的结果表格(红色虚线框内),详见原文:Lan T, Wang X R, Zeng Q Y. Structural and functional evolution of positively selected sites in pine glutathione S-transferase enzyme family. J Biol Chem, 2013, 288: 24441-24451.

注意事项: 为什么找到的正选择位点在原始比对序列中找不到?

答:最主要原因可能是比对序列中带有gap,codeml默认忽略gap所带的一列数据 ,从而导致位置发生偏移。因此,分析前最好将带gap的同一列序列全部手工删除,找到正选择位点的氨基酸位置后,再还原对应到原始比对序列上。




https://blog.sciencenet.cn/blog-460481-922784.html

上一篇:《生物信息学分析实践》第九次印刷
下一篇:群体结构分析之Structure 篇完整版(By Raindy)
收藏 IP: 27.155.137.*| 热度|

2 孙瑜隆 赵凤利

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 12:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部