科学网

 找回密码
  注册
搜索
查看: 5786|回复: 2
打印 上一主题 下一主题

[原创] 一文掌握GO和pathway分析

[复制链接]
跳转到指定楼层
楼主
发表于 2016-9-27 11:27:43 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
上次1分钟系列介绍了差异基因结果解读,那如何从众多差异基因中筛选出目标基因呢?
下面小编就以一篇文章为例,来看看用什么方法可以缩小差异基因范围,使目标基因挑选更有针对性。


文章案例
Identification of a novel biomarker, SEMA5A, for non-small cell lung carcinoma in nonsmoking women
相关基因:SEMA5A
相关疾病
Carcinoma, Non-Small-Cell Lung;Lung Neoplasms
PMID: 20802022       影响因子3.622         GEO 相关样本:120
文章作者使用Affymetrix U133plus2.0芯片1检测了台湾地区非吸烟肺癌女性患者60对癌症和癌旁肺组织样本,利用配对T检验筛选了肿瘤组织中687个差异表达基因2,并且利用逆转录PCR和免疫组化进行了验证。如何将687个缩小范围呢?因此我们需要判断差异基因在肺癌细胞中主要富集在哪些功能类群和代谢通路。文章作者利用IPA(Ingenuity Pathway Analysis)软件对差异基因进行了功能分析,筛选出了16条显著性代谢通路3。在最显著改变的三条通路中,其中两条都和轴突导向信号通路(axon guidance)相关,作者很意外,于是就选定了轴突导向信号通路,并在其中挑选了差异表达倍数最高的SEMA5A基因作为后续的研究对象。作者最后利用kaplan-Meier生存分析证明了SEMA5A基因的低表达和非吸烟女性肺癌的低生存率有关联,其可能成为非小细胞肺癌预后的一个有效的生物标志物,也可能代表台湾地区病人的性别特异性。
归纳一下作者的整体思路,先找差异基因,并通过功能分析进一步缩小差异基因的范围,再从中有针对性的挑选基因。


在差异基因的功能分析中,主要有GO功能分析和pathway分析,上面案例作者主要用了pathway分析。


名词解释
GO
GOGene ontology的缩写,GO数据库分别从功能、参与的生物途径及细胞中的定位对基因产物进行了标准化描述,即对基因产物进行简单注释,通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。
Pathway
Pathway指代谢通路,对差异基因进行pathway分析,可以了解实验条件下显著改变的代谢通路,在机制研究中显得尤为重要。
GO分析好比是将基因分门别类放入一个个功能类群的篮子,而pathway则是将基因一个个具体放到代谢网络中的指定位置。


文章分析结果
小编利用上述案例中的数据GSE19804GCBI在线实验室首先进行差异分析(|fold change|>2, P<0.001 Q<0.05),得到了2202个差异基因。将差异基因分别进行GO(P<0.01FDR<0.01)pathway分析(P<0.05),富集得到351GO term110pathway。结果如下图所示,表一和表二分别为部分GO富集结果和最显著的15pathway分析结果。




结果怎么看呢?
表头各个参数的解释如下,其中,重点看三个指标, enrichment scorep值和FDRPathway分析主要看P值和FDR值,两者越小越好。GO分析还可看enrichment score,数值越大表示某个GO term越容易受到实验因素的影响。


GOpathway分析结果中都得到了文章中选定的axon guidance这个结果(红框)
如何定位到基因呢?
axon guidance中的差异表达基因全部挑选出来,列表如下。作者在文中挑选了显著性最高的SEMA5A作为后续的研究对象。在我们的分析中,当p值小于10^-6时默认为0,按照表达倍数排列SEMA5A也排在前列,和作者的结果较吻合。


Ps:因参数设置和文章中不同,结果仅供参考。


教程:GOpathway分析
目前有许多GOpathway分析软件,GO分析软件有Avadis(商业软件)BiNGO(开源java)DAVID(基于web的工具)等,pathway分析有IPAMetaCore(商业软件)等。
但这些软件学习成本高,且许多都是商业软件。有没有一种分析方法无门槛,直接上手就可以搞定的呢?
GCBI平台,
伸手党的福音,生信分析方法直接加载了模块,你需要做的只是创建方案,拖动模块,单击运行即可。小编用样本GSE19804演示一下,倒数10minGO富集分析,pathway分析全搞定。
1
进入GCBI网站的在线实验室 https://www.gcbi.com.cn(需注册才能使用)
2
建立项目——方案,在方案界面,拖动模块,修改名字和参数,并用连接线将模块连接成一个方案,小编建立了如下差异分析和GOpathway分析方案。


3
选择样本数据。
样本数据GSE19804直接来自于GCBI样本库,将样本发送到在线实验室。点击方案中样本模块,在样本分组管理中选择配对样本,选择好相应的对照组和实验组样。Lung normal **N为对照组,Lung cancer **T为实验组。


4
设置各模块参数
差异分析              |fold change|>1.2 P<0.05 Q<0.05
GO分析
分析类型
生物功能分析p<0.01 FDR<0.01
Pathway分析       p<0.05
5、运行方案
是不是毫无压力?





附录:
文献技术及参数:
1、检测手段: GeneChip Human Genome U133 Plus 2.0 expression arrays (Affymetrix, Inc.)
2、差异筛选:配对 t 检验 (P < 10^-16) Bonferroni 校正P
3pathway分析:IPA软件
费希尔精确检验(fisher’s exact test)-log(P)>1.3


检测工具选择
可使用其他检测工具
GeneChip® Human Gene 2.0 arrays
GeneChip® Human Transcriptome Array 2.0(推荐)


拓展知识
差异分析基因结果解读
功能及信号通路分析及结果解读

QQ截图20160922144725_副本_副本.png (49.64 KB, 下载次数: 23)

QQ截图20160922144725_副本_副本.png

QQ截图20160926165158_副本.png (111.6 KB, 下载次数: 27)

QQ截图20160926165158_副本.png

QQ截图20160926165551_副本.png (97.26 KB, 下载次数: 29)

QQ截图20160926165551_副本.png

QQ截图20160926184927_副本.png (70.33 KB, 下载次数: 23)

QQ截图20160926184927_副本.png

QQ截图20160926194909.png (11.21 KB, 下载次数: 22)

QQ截图20160926194909.png

未标题_副本_副本.png (46.43 KB, 下载次数: 29)

未标题_副本_副本.png

未标题-3_副本_副本.png (18.28 KB, 下载次数: 27)

未标题-3_副本_副本.png

QQ截图20160922144725_副本_副本.png (49.64 KB, 下载次数: 18)

QQ截图20160922144725_副本_副本.png

QQ截图20160926165158_副本.png (111.6 KB, 下载次数: 30)

QQ截图20160926165158_副本.png

QQ截图20160926165551_副本.png (97.26 KB, 下载次数: 23)

QQ截图20160926165551_副本.png

QQ截图20160926184927_副本.png (70.33 KB, 下载次数: 24)

QQ截图20160926184927_副本.png

QQ截图20160926194909.png (11.21 KB, 下载次数: 30)

QQ截图20160926194909.png

未标题_副本_副本.png (46.43 KB, 下载次数: 24)

未标题_副本_副本.png

未标题-3_副本_副本.png (18.28 KB, 下载次数: 21)

未标题-3_副本_副本.png
回复

使用道具 举报

沙发
发表于 2017-8-29 15:38:34 | 只看该作者
:niu
回复 支持 反对

使用道具 举报

板凳
发表于 2017-8-29 15:38:42 | 只看该作者
:niu:niu:niu:niu
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2017-9-21 04:14

Powered by ScienceNet.cn

Copyright © 2007-2017 中国科学报社

快速回复 返回顶部 返回列表