流程:
(1)表达谱数据的收集整理
首先从Genelibs数据库查找研究正常人与疾病患者基因的表达谱数据。
示例数据:
疾病:儿童肿瘤相关
数据来源: EMBL-EBI数据库
平台:Affymetrix GeneChip Human Gene 1.0 ST Array [HuGene-1_0-st-v1]
(2)利用SAM筛选差异表达基因
首先根据不同样本进行分组(对照组和实验组),利用SAM算法分别计算基因的差异表达情况,共筛选出差异表达基因。
(3)鉴别致病网络,预测致病基因
1)从疾病基因相关数据库中下载检测疾病中已知的致病基因,与表达谱中的基因取交集,得到致病基因并将其和差异基因一起,作为seed genes.
2)从基因相互作用数据库中获取人类所有基因之间的互作关系网络;从网络中取出与seed genes有互作关系的蛋白对,并将其组成一个网络A; 从网络A中再提取出一个网络B(网络B中的每个基因至少和2个seed genes有互作关系),且网络B被认定为致病网络,其中的基因与发病机理有关。
根据候选致病基因和seed genes之间的互作关系和共表达关系,对网络B中的每一个基因赋予一个weight值,weight值越高,说明其越有可能是潜在的致病基因(即候选基因),最有可能参与到致病过程(例子见下表,列出了前10个)。
3)利用Genelibs中的网络模块软件对致病网络B中进行模块分析,得到3个模块。为了检测这3个模块的重要性,对每个模块定义一个显著分值(SS值),为了检测这3个模块的统计学显著性,对每个cluster进行随机置换检验。
4)预测的致病基因(候选基因)可能富集的通路
将seed genes和候选基因一起通过DAVID在线软件进行通路分析,
得到结果(结果示例):
(注:带有着重符号的基因为seed gene)
图中候选基因与seed gene参与同样的生物学过程,则说明这些候选基因是潜在的致病基因。
(4)总结:
此分析利用基因组芯片表达谱数据,在结合疾病相关数据库和基因网络数据库,分析并查找了疾病的关键基因。
此流程已经可以在Genelibs平台上在线开放运行,为中级项目,目前为免费使用,
测试和使用请致电:0531-88819269
项目文档为Genelibs平台所有,如需转载,需要标明出处。
关注微信订阅号,实时查看信息,关注医学生物学动态。