基因云馆新一代信息数据库

知识决定起点,智慧带来突破,欢迎使用新一代生物学、医学数据库。

站内模块搜索

关闭

LIMMA差异分析

项目名称

LIMMA差异分析

项目等级

2

项目类型

差异分析

开始时间

2015-12-11 10:37:17

项目简介

LIMMA是一个使用线性模型,分析高通量分析中组间的差异基因的方法,这种方法已经被广泛应用于高通量分析,是一种经典方法。

模块购买

新模块开发后的18个月为收费期,在此期间,您若是需要进行模块分析,请联系当地经销商,如果您无法找到当地经销商,请联系总部,获取经销商联系方式。

同时,如果您是一个开发者,也可以联系我们进行模块开发,我们将提供广阔的平台,给予一定的报酬。

项目详情


本模块应用LIMMA算法,可以分析简单的两组或多组间的差异表达基因,这种分析可以得出在单因子(或多因子)条件下,或者在时间序列中,基因表达差异的变化。 

通过LIMMA法,鉴定疾病的差异基因,通过吸引子算法,计算疾病的差异通路,并进行差异基因的火山图,倍增关系图,目的基因差异箱式图的绘制。同时将结果以表格的形式进行存储。

一般在分析过程中我们考虑因子的作用和样本间差异因素。当然,重复数量越多,所得的结果也就越精确。

在LIMMA的算法中,是采用了一种贝叶斯模型(Empirical Bayes test statistics),是线性分析的延伸。这种模型相比于以前的分析模型,好处是在处理较少的样本量的时候,可以得出更加精确的结果。

LIMMA可以广泛的应用于芯片和测序分析中的统计检验分析。


差异分析的教程


1、首先要进行 GEO 数据库检索,如何检索请参阅GEO数据库检索,检索完成后,输入我们感兴趣数据的数据号,现在就以 GSE75037为例进行分析, 如Pic7所示 。

Pic7.png


2、然后点击运行,这时会生成一系列的文件,如Pic8。这些中.RData是后期所需要的,然后点击html文件查看报告,如Pic9所示,看看报告中列名称有无空格。若有空格的话,数据信息需要更改,而且我们是要进行差异分析的,所以需要操作表达集数据信息和基因表达集生成器这一步骤。

pic8.png



pic9.png



四、表达集数据信息

1、进入后需要把本地化那一步的 .RData 放入,如Pic10。

pic10.png


2、点击运行,就会生成类似第一步中的很多文件,两个 .CSV 是我们所需要的,如Pic11。将生成的 “pDatamatrix.csv” 保存后根据需要进行更改,如Pic12。(要做到:第一个csv文件的列名称与第二个csv文件的行名称对应且无空格;分组列中名称后无空格且分组名称尽量简单)修改完成后保存备用。(如 PData 的行名称更改,则 exprsmatrix.csv 的列名称也要做相应的改变)。点击html即可查看报告,如Pic13所示。

pic11.png


Pic12.png

pic13.png


五、基因表达集生成器

将修改好的“exprsmatrix.csv"文件放matrix*;将“pDatamatrix.csv "文件放入pData*中,根据需要填写保存名称,运行即可,如Pic14。

pic14.png


运行结束生成一个新的RData文件及报告等,如Pic15。

pic15.png

点击html 查看报告,如Pic16。

pic16.png

六、芯片数据预处理

在预处理模块选择“芯片数据预处理”,将新生成的.RData文件放入eSetPath*,在platform*处选择相应平台,这里的选择依据是在GEO数据库检索的时候,会有一个平台号,及platform信息,请你记录这个信息,并且选择对应的平台号。    

groupName*处填入分组列的列名称(一般取名为groups),点击运行,如Pic17。

pic17.png

运行结束会生成新的RData文件及报告,如Pic18所示。

pic18.png

pic18.png七、表达集取子集

对照组中除了一直吸烟与从不吸烟外还有其他的,所以要进行表达集取子集这一步骤,就是把对照组拿出来做分析,点击表达集取子集后,把上一步中的.RData输入 eSetPath* ,在 groupnames 中写上取子集的名称,用逗号隔开,点击运行,生成了新的 .RData,如Pic19。

pic19.png

生成了新的.RData,如Pic20。

1483953256666002425.png

八、差异基因分析

1、按照提示输入,inputset*中输入上一步的.RData,logFC*和pvalue*是阈值,可以调节这两部分来得到差异基因的数量,输入完后,点击运行,如Pic21。

1483953274289084790.png


2、,就可以生成html ,点击html就可以查看报告,如Pic22。


P22.png

九、查看报告结果

报告中显示共筛选出差异较大的表达基因37个,在这个平台的 基因搜索模块 对比较有代表性的几个基因进行了搜索,可以看到基因的基本信息、基因在染色体的位置、基因表达等,其中还包括基因的相关疾病,如下图所示,每个基因下面都有几个疾病名称,通过疾病名称我们可以知道该基因导致哪种疾病。如下图所示。


FGG.png


比如搜索FGG基因,可以看到FGG基因可以导致瘢痕瘤、静脉血栓栓塞等与肺癌相关的疾病,并且FGG基因还与其他癌症有关;TYRP1基因可以导致腺癌肺肿瘤、恶性黑素瘤等疾病;IYD基因可以导致甲状腺机能减退、急性焦虑症、地方性呆小病等疾病;CYP3A5基因可以导致肾病、血栓症、肝硬化、神经中毒综合征等疾病;CCL20基因可以导致肺炎、溃疡性结肠炎、结肠肿瘤、糖尿病等;CYP24A1基因可以导致肺肿瘤、肾功能不全、前列腺恶性肿瘤等。



其他热门资源

GEO数据库检索

NCBI的基因表达汇编(GEO)计划。GEO的...

LIMMA差异分析

LIMMA是一个使用线性模型,分析高通量分析...

KEGG数据库

KEGG(Kyoto Encyclopedia of Genes and Gen...

IPA数据库

IPA是一个一体化并以网络为基础的应用软件...

联系方式

山东省济南市 高新区 崇华路359号 三庆世纪财富中心C1115室

电话: 0531-88819269

E-mail: product@genelibs.com

微信公众号

关注微信订阅号,实时查看信息,关注医学生物学动态。