基因云馆新一代信息数据库

知识决定起点,智慧带来突破,欢迎使用新一代生物学、医学数据库。

云馆首页 > 资源列表 > 资源详情

多角度分析表达谱数据获得初步结果

开发时间:2018-03-08 23:00:26   

多角度分析表达谱数据获得初步结果

介绍:

通过差异和基因互作进行疾病相关基因的初步预测。

流程图:

 图片 1.png

 

 

具体流程描述:
1.芯片数据的收集整理
目前已有获得公认的基因芯片数据库,如GEO数据库,EMBL-EBI数据库。这些数据库存储了世界各地各个实验室上传的基因芯片实验数据信息,可供科研人员免费使用。首先从这些数据库下载芯片数据,并下载芯片注释文件。从该数据库可以查到研究正常人与疾病患者基因表达的基因芯片数据。

示例数据:

疾病:colon cancer(结肠癌)

数据来源:GEO数据库, EMBL-EBI数据库

物种:人类

拟选择题目:protein-protein interaction network and mechanism analysis of colon cancer


2.
差异基因的筛选
差异表达基因(differentially expressed gene, DEG),是指在病例和对照之间表达量不同的基因。如果某个基因在病例中高表达(或低表达),而在正常对照中低表达(或高表达),那么,该基因可能和此疾病的发生有关,值得进一步研究分析。将第1步中下载的数据通过统计学方法进行分析,可以筛选出差异表达的基因:首先进行标准化,然后利用BMA法分别计算疾病的基因的差异表达情况,筛选出差异表达基因。

3.差异表达基因的信号通路富集分析

KEGG数据库收集了大量代谢通路数据信息。可以通过使用DAVID在线软件,对差异表达的基因进行信号通路分析,得出这些差异表达的基因富集在哪些信号通路,从宏观层面上对这些基因进行观察研究。

4. 差异表达基因的生物学功能富集分析

GO 数据库收集了大量基因的涉及的生物学过程相关信息。通过该数据库,可以对差异表达基因进行所在生物学途径的功能富集分析,得出这些基因主要参与的生物学功能,也是从宏观层面上对这些基因进行观察研究。

5.蛋白质相互作用 (PPI) 网络数据的构建
蛋白质相互作用(protein-protein interaction)网络是研究蛋白质间相互作用,寻找起关键作用的蛋白质及其基因的方法。构建蛋白质互作网络,首先应获得蛋白质间相互互作信息,这些信息可以从String数据库下载,然后使用Cytoscape软件进行PPI网络图构建。通过构建的PPI网络,我们可以从中发现参与蛋白质间相互作用最复杂的蛋白质(见下方PPI示例图),也就知道了编码该蛋白的基因,从而可以对该基因进一步研究。

6.HUB 蛋白及其模块分析
对网络进行统计分析(联通度、介数中心性等)及模块分析。
7.miRNA 和lncRNA 靶位点的预测,得到潜在的 调控信息
利用 miRecords,TargetScan 等几个预测工具,预测 mRNA上下游调控。
8.根据以上内容,说明疾病代谢通路上,以及 miRNA 等方面的发病机理

 

EMBL-EBI数据库示例:

 

图片 2.png

 

PPI网络示例图:颜色最深的红色蛋白质是参与蛋白相互作用最复杂的蛋白质。

图片 3.png

联系方式

山东省济南市 高新区 崇华路359号 三庆世纪财富中心C1115室

电话: 0531-88819269

E-mail: product@genelibs.com

微信公众号

关注微信订阅号,实时查看信息,关注医学生物学动态。