为了支持公共使用和分享基因表达数据,NCBI开始了基因表达汇编(GEO)计划。
GEO是努力建立一个基因表达数据仓库和在线资源,用于从任何物种或人造的来源检索基因表达数据。
此模块可以将GEO上的数据文件本地化,将其转化为平台所用的格式,使其可以在平台上进一步的处理,同时,也将记录相关的平台信息,注释信息等文件,对应下步的内容处理。
来自microarray、二代测序、高密度寡核苷酸array(HAD)、杂交膜(filter)和SAGE的许多类型的基因表达数据都可以被接受,登记,和存档,作为一个公共数据集合。
用户可以方便的在GEO搜索框中检索关于疾病的各种数据。即直接在搜索框中输入疾病的英文名称,就可以获得所有与这个疾病相关的基因表达数据。
数据仓库简介
GEO结果分为几个重要的部分
标题:数据集的名称,类似于文章的标题
综述:简要介绍数据集的内容,如实验方法,步骤,结果,结论等。
平台:高通量实验使用的平台,一般是平台的商品代码。
引用:如果此数据集已经发表,那么这里显示的就是数据集的文献。
平台号:一般以GSE加数字表示,是平台数据集的唯一识别号,这个号也可以用于数据集在基因云馆平台本地化。
平台模块的使用方法
在GEO平台中找到我们需要的数据后(例如,某些疾病数据,细胞系数据等等),您就可以记录下该数据的平台号,并在云馆平台中进行本地化了。
所谓本地化,就是将GEO里的数据,变成平台可以识读的格式。
点击上面的进入系统运行模块按钮,登入平台操作,如果您还没有注册,您需要先进行免费注册。
登入后显示
在框中输入平台号,点击运行即可。结果如下所示:
结果即可进行进一步的预处理、分析等操作了。
关注微信订阅号,实时查看信息,关注医学生物学动态。