基因云馆新一代信息数据库

知识决定起点,智慧带来突破,欢迎使用新一代生物学、医学数据库。

云馆首页 > 资源列表 > 资源详情

KEGG数据库

开发时间:2015-12-11 10:40:23   


在后基因时代一个重大挑战是如何使细胞和有机体在计算机上完整的表达和演绎,让计算机利用基因信息对更高层次和更复杂细胞活动和生物体行为作出计算推测,为达到此目的,人工建立了一个在相关知识基础上的网络推测计算工具即由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立的KEGG数据库。 

KEGG 的PATHWAY 数据库整合当前在分子互动网络(比如通道,联合体)的知识,KEGG 的GENES/SSDB/KO 数据库提供关于在基因组计划中发现的基因和蛋白质的相关知识,KEGG 的COMPOUND/GLYCAN/REACTION数据库提供生化复合物及反应方面的知识。其目的是由细胞或生物体的基因组信息去了解其较高层次的功能与作用之生物信息资源,也就是整理出现存的调控网络,并建立其中每个组件与基因间的关系,一但研究者找到基因即可透过KEGG,让研究者由基因组至细胞层次做一整合性连结,并对生命现象做in silico 分析与其他数据库相比,KEGG 的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其所要研究的代谢途径有一个直观全面的了解。虽然KEGG 的工作受到肯定,但距离理想目标还有一大段距离,因为反应路径图上的每一个关系都应有文献资料做后盾,我们不能只相信一张可能带有个人偏见的路径图。

目前数据库中虽已建立各基因与其它数据库的关系,但它缺少的是讨论到路径正确性或调控机制的数据。


KEGG现在由6个各自独立的数据库组成,分别是基因数据库(GENES  database)、通路数据库(PATHWAY database)、配体化学反应数据库(NGAND database)、序列相似性数据库(SSDB)、基因表达数据库(EXPRESSION)、蛋白分子相互关系数据库(BRITE)等。

1. 通路数据库(PATHWAY database):储存了基因功能的相关信息,通过图形来表示细胞内的生物学过程,例如代谢,膜运输,信号传导和细胞的生长周期。在通路数据库(PATHWAY database)中,有一部分由ortholog group图表组成的保守的亚通路(通路基序)信息。亚通路是由染色体位置偶联的基因编码的,它对预测基因的功能有很大的作用。

2. 通路数据库(PATHWAY database):代谢通路是建立得最好的,有大约90个参考代谢途径的图形。每个参考代谢途径是一个由酶或EC号组成的网络。利用如下方法可通过计算机构建出生物体特有的代谢通路:先根据基因的序列相似性和位置相关性确定基因组中酶的基因,然后合理地安排EC号,最后将基因组中的基因和参照通路中用EC号编号的基因产物结合起来

3. Orthologgroup图表:在KEGG中目前有83个ortholog图表。Ortholog对单个基因的序列的相似性进行识别,检查功能组(如保守的亚通路或分子复合物)中所有组分。KEGG ortholog grope图表表达了三个特征:

①一个生物体是否具备组成一个功能组的完整基因;

②这些基因是否偶联在染色体上;

③在不同生物体中的orthologous基因是什么。

例如在基因组中的一个基因簇编码代谢通路中的功能相关的酶簇。在KEGG中,这样的相关簇首先被一个启发式的图表比较算法检测,然后手工编辑为ortholog group图表。现有两种类型的图表比较法,基因组—通路和基因组—基因组比较法。一个ortholog grope图表是这样一组比较的组成部分,它代表了一个通路的保守的部分,也就是通常说的通路基序。

4. 蛋白—蛋白反应:KEGG通路表达的重点在于由基因产物的构成的网络上,其中包含大多数蛋白和功能性RNAs。代谢通路是蛋白—蛋白的间接相互作用(实际上是酶—酶相互作用)形成的网络。而调节通路是蛋白—蛋白的直接相互作用(如结合,磷酸化)和另一种蛋白—蛋白的间接相互作用(通过基因表达与转录因子及基因的翻译产物相关联)构成的网络。一般的蛋白—蛋白的相互作用包括了上面所述的这三种形式的相互作用,它是一个抽象的网络,但是它在与基因组信息的连接中起到关键作用,这样网络中的节点(基因产物)与基因织中的节点(基因)就可以直接相连。有了这样一个蛋白—蛋白相互作用的网络,就可以增加手工绘制的参考通路图了。

5. KEGG的另一个数据库LIGAND,包含关于化学物质、酶分子、酶反应等信息。通过与世界上其它一些大型生物信息学数据库的连接,KEGG可以为研究者提供更为丰富的生物学信息(LinkDB)。KEGG提供了Java的图形工具来访问基因组图谱,比较基因组图谱和操作表达图谱,以及其它序列比较、图形比较和通路计算的工具,可以免费获取。

6. KEGG建立了KEGG直系同源系统(theKEGG Orthology (KO)system),这个系统通过把分子网络的相关信息连接到基因组中,从而发展和促进了跨物种注释流程。·结果表明,KEGG被当做一个参考知识库,被广泛的用于基因组测序和其他高通量实验技术得到的大规模数据集的整合和解释中。除了保持对基础研究的支持,随着KEGG分子网络的一些小变化,KEGG正在朝着更加偏向于实际应用的方向发展,这些应用主要集中在整合人类疾病、药物和其他与健康相关的物质。


KEGG数据库将庞杂的生物信息系统的整理,方便用户提取所需信息并可进行如下研究


1组合生物合成(combinatorialbiosynthesis)包括途径重组和基因模块重组前者是募集同源或异源的不同酶基因,构建共同表达载体。后者是重排基因模块,使重组菌产生非天然化合物,从中筛选获得新的生物活性物质。KEGG恰好提供了基因酶及其催化途径信息。


2信号转导工程:KEGG提供了基因细胞与环境之间的联系,通过分析现有数据,可望重塑信号转导网络。新构建的细胞信号网络有利于调控代谢流量,并充分考虑能量平衡,从而最大程度的积累目标产物。


3酶催化途径定位:可结合酶活分析及Northern印迹杂交检测,可从KEGG PATHWAY中准确地锁定限速步骤。


4数量性状位点分析:通过克隆高产和低产菌种的差异表达基因,结合代谢流量分析和关键酶活性分析,借助KEGG PATHWAY的图形展示功能,便可直观地将差异表达基因定位于代谢途径。


5新一代染色体改造工程:在了解生物合成途径以及调节机理的基础上,对基因进行删除 添加取代或重组,可以在一定程度上提高目标产物的产量。传统菌种改造通过大量敲除或超表达关键基因,难以最大限度地挖掘菌种的生产能力,原因是冗余基因带来的细胞负荷。随着基因功能的解析,以及DNA组长技术的成熟,创造最小基因组的新物种成为现实,新物种的每个基因都满负荷工作,该研究代表了当今合成生物学的前沿


使用基因云馆进行通路富集分析


在云馆,您只需要将关注的基因的简称收集起来,就可以进行通路的富集分析,可以方便的知道,我们的所研究的基因集合,在哪一个通路中。

富集分析的模块,采用的是经典的Fisher法进行基因的富集分析,使您的分析更具权威性。


分析方法:

点击上面的“进入系统运行模块”按钮(如果没有注册需要先免费注册)。

在input_gene框里填写感兴趣的基因集合,基因名称使用标准简称(Symbol),基因与基因见用逗号隔开。

输入基因后,在pathway_select位置选择KEGG通路数据库。

最后,点击"运行"即可显示结果。


基因填写的数量一般在20-300为宜。


image.png

联系方式

山东省济南市 高新区 崇华路359号 三庆世纪财富中心C1115室

电话: 0531-88819269

E-mail: product@genelibs.com

微信公众号

关注微信订阅号,实时查看信息,关注医学生物学动态。