GEO数据库查询

分析流程

查询GEO数据库的内容,并找寻相关疾病

简介

GEO是一个基因表达数据仓库和在线资源,可以检索人或者其他物种的来源的基因表达数据。

作为一个公共数据集合,GEO数据库包含着基因芯片、二代测序、高密度寡核苷酸芯片(HAD)、杂交膜(filter)和SAGE等许多类型的基因表达数据。 用户可以方便的在GEO搜索框中检索关于疾病的各种数据。即直接在搜索框中输入疾病的英文名称,就可以获得所有与这个疾病相关的基因表达数据。

在云馆中你可以将GEO上的数据文件本地化,将其转化为平台所用的格式,使其可以在平台上进一步的处理,同时,也将记录相关的平台信息,注释信息等文件,对应下步的内容处理。

点击进入搜索页,点击选择搜索框下方的实验库

GEO数据

GEO结果分为几个重要的部分

标题:数据集的名称,类似于文章的标题

综述:简要介绍数据集的内容,如实验方法,步骤,结果,结论等。

平台:高通量实验使用的平台,一般是平台的商品代码。

引用:如果此数据集已经发表,那么这里显示的就是数据集的文献。

平台号:一般以GSE加数字表示,是平台数据集的唯一识别号,这个号也可以用于数据集在基因云馆平台本地化。

平台模块的使用方法

在GEO平台中找到我们需要的数据后(例如,某些疾病数据,细胞系数据等等),您就可以记录下该数据的平台号,并在云馆平台中进行本地化了。

本地化

所谓本地化,就是将GEO里的数据,变成平台可以识读的格式。 点击上面的进入系统运行模块按钮,登入平台操作,如果您还没有注册,您需要先进行免费注册。

登入后显示在框中输入平台号,点击运行即可。

GEO本地化模块链接

参考文献

[1] Edgar R, Domrachev M, Lash AE. Gene Expression Omnibus: NCBI gene expression and hybridization array data repository Nucleic Acids Res. 2002 Jan 1;30(1):207-10

[2] Barrett T, Wilhite SE, Ledoux P, Evangelista C, Kim IF, Tomashevsky M, Marshall KA, Phillippy KH, Sherman PM, Holko M, Yefanov A, Lee H, Zhang N, Robertson CL, Serova N, Davis S, Soboleva A. NCBI GEO: archive for functional genomics data sets--update. Nucleic Acids Res. 2013 Jan;41(Database issue):D991-5.