基因云馆新一代信息数据库

知识决定起点,智慧带来突破,欢迎使用新一代生物学、医学数据库。

云馆首页 > 资讯文章 > 生信学习 > 文章详情

利用相互作用网络的方法分析表达谱数据

来源/作者:genelibs   发表时间:2016-03-22 19:06:15  
分享到:   

利用相互作用网络的方法分析表达谱数据

介绍:

在生物体中,蛋白质功能的发挥往往需要多个或多种蛋白质共同作用才能完成。计算机模拟方法和高通量的蛋白质互作检测技术的发展为人们研究蛋白质的相互作用提供了大量的数据,极大地丰富了蛋白质互作数据资源。

流程图:

具体流程描述:

1.芯片数据的收集整理
目前已有获得公认的基因芯片数据库,如GEO数据库,EMBL-EBI数据库。这些数据库存储了世界各地各个实验室上传的基因芯片实验数据信息,可供科研人员免费使用。首先从这些数据库下载芯片数据,并下载芯片注释文件。从该数据库可以查到研究正常人与疾病患者基因表达的基因芯片数据。

示例数据:

疾病:colon cancer(结肠癌)

数据来源:GEO数据库, EMBL-EBI数据库,二代测序数据

物种:人类

拟选择分析思路:protein-protein interaction network and mechanism analysis of colon cancer

2.差异基因的筛选
差异表达基因(differentially expressed gene, DEG),是指在病例和对照之间表达量不同的基因。如果某个基因在病例中高表达(或低表达),而在正常对照中低表达(或高表达),那么,该基因可能和此疾病的发生有关,值得进一步研究分析。将第1步中下载的数据通过统计学方法进行分析,可以筛选出差异表达的基因:首先进行标准化,然后利用BMA法分别计算疾病的基因的差异表达情况,筛选出差异表达基因。

3.差异表达基因的信号通路富集分析

KEGG数据库收集了大量代谢通路数据信息。可以通过使用Genelibs在线软件,对差异表达的基因进行信号通路分析,得出这些差异表达的基因富集在哪些信号通路,从宏观层面上对这些基因进行观察研究。

4. 差异表达基因的生物学功能富集分析

GO 数据库收集了大量基因的涉及的生物学过程相关信息。通过该数据库,可以对差异表达基因进行所在生物学途径的功能富集分析,得出这些基因主要参与的生物学功能,也是从宏观层面上对这些基因进行观察研究。

5.蛋白质相互作用 (PPI) 网络数据的构建
蛋白质相互作用(protein-protein interaction)网络是研究蛋白质间相互作用,寻找起关键作用的蛋白质及其基因的方法。构建蛋白质互作网络,首先应获得蛋白质间相互互作信息,这些信息可以从String数据库下载,然后使用Genelibs在线平台的作图软件进行PPI网络图构建。通过构建的PPI网络,我们可以从中发现参与蛋白质间相互作用最复杂的蛋白质(见下方PPI示例图),也就知道了编码该蛋白的基因,从而可以对该基因进一步研究。

6.HUB 蛋白及其模块分析

对网络进行统计分析(联通度、介数中心性等)及模块分析。

EMBL-EBI数据库示例:


PPI网络示例图:颜色最深的红色蛋白质是参与蛋白相互作用最复杂的蛋白质。

Fig

此分析已经可以在Genelibs平台中免费运行了,为中级模块,使用请致电:0531-88819269

项目文档为Genelibs平台所有,如需转载,需要标明出处。

联系方式

山东省济南市 高新区 崇华路359号 三庆世纪财富中心C1115室

电话: 0531-88819269

E-mail: product@genelibs.com

微信公众号

关注微信订阅号,实时查看信息,关注医学生物学动态。