hayidahubei的个人博客分享 http://blog.sciencenet.cn/u/hayidahubei

博文

上传NGS数据到GEO

已有 6538 次阅读 2018-12-4 07:38 |系统分类:科研笔记| GEO, 高通量测序, RNA-seq, ChIP-Seq, GEO, ChIP-Seq

以下信息都是基于个人最近一年的经验。GEO网站可能会更新,具体信息可以登录GEO官网查看。


上传数据官网:https://www.ncbi.nlm.nih.gov/geo/info/submission.html

 

1 注册账号

https://www.ncbi.nlm.nih.gov/account/register/?back_url=/geo/submitter/


文件准备:上传的文件包含三部分(一个Excel表格,处理的数据文件,原始数据)

详情请根据以下网站https://www.ncbi.nlm.nih.gov/geo/info/seq.html


第一部分是一个Excel表格(a metadata spreadsheet)里面有本次课题的基本信息,所有文件信息。按要求填好。metadata spreadsheet的模板可以从以下链接下载:https://www.ncbi.nlm.nih.gov/geo/info/examples/seq_template_v2.1.xls


第二个部分是processed data files. 包含完整的表达谱(行基因,列样本,值可以是标准化后的也可以是原始的read count),peak信息文件(bed, txt),可视化文件(bigwig, WIG, bedGraph). 我一般会准备一个表达谱(RNA-seq)或者bigwig和peak文件(ChIP-Seq)


第三部分是原始数据,对于NGS数据而言就是原始的fastq文件。但是这里GEO强烈建议上传压缩的文件。我一般都是压缩为.gz文件


将准备好的三部分文件全部放到以你账号名相同的文件夹中。例如你的账号名为“zhangsan,你就需要创建一个文件夹名字为“zhangsan然后将所有文件放到这个文件夹中。





3 上传文件(这里仅以FTP为例)

https://www.ncbi.nlm.nih.gov/geo/info/submissionftp.html#creds


我用FileZilla登录GEO host, ftp-private.ncbi.nlm.nih.gov; username, geo; password, ******)。具体账号信息网页上会有。


登录上GEO后直接将上面的文件拖拽到GEO,如下图所示



4 通知GEO你已经上传完文件。

   https://submit.ncbi.nlm.nih.gov/geo/submission/

  

我每次都是通过两种方式通知GEO。第一种方式是通过以上链接,第二种方式是通过email geo@ncbi.nlm.nih.gov.


 Email 内容如下:

 

 

5 等候GEO的回信。我一般在两天内收到回信,里面会给你一个GSE





6 文章接收后就可以登录GEO修改数据状态,release你的数据

 




https://blog.sciencenet.cn/blog-1113671-1149718.html

上一篇:FPKM, RPKM, RPM以及TPM的关系之见解
下一篇:虚拟机Ubuntu中添加硬盘
收藏 IP: 130.91.194.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 03:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部