GO功能注释及富集分析
询价
医药制品检测
北京百泰派克生物科技有限公司
北京 大兴区 北京市经济技术开发区科创六街88号院 100000 负责人: 李欣, 联系人: 李欣电话: 010-57231915, 手机:18244218588
传真: , Email:market@biotech-pack.com
GO(Gene Ontology)是基因本体联合会(Gene Ontology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准,适用于各物种。通过建立一套具有动态形式的控制字集(controlled vocabulary),来描述基因及蛋白质在细胞内所扮演的角色,从而来全面描述生物体中基因和基因产物的属性。GO数据库总共有三大类,分别是生物学过程(Biological Process, BP)、细胞定位(Cellular Component, CC)和分子功能(Molecular Function, MF),各自描述了基因产物可能行使的分子功能,所处的细胞环境,以及参与的生物学过程。GO数据库中一个基本的概念是节点,每个节点都有一个名称,比如“Cell”、“Fibroblast Growth Factor Receptor Binding”或者“Signal Transduction”,同时有一个唯一的编号,如“GO:nnnnnnn”。基于鉴定到的蛋白ID,采用mapping的方式从Uniprot数据库中得到蛋白质的GO数据库注释信息,对蛋白质进行功能分类注释。针对BP,CC和MF中所涉及的GO节点,列出所有相应蛋白质个数,同时分别对表达蛋白的二级分类情况做出统计图。
1. GO二级分类统计图
图1 差异表达蛋白的GO二级注释
注:横坐标为GO分类,纵坐标左边为蛋白数目所占百分比,右边为蛋白数目。此图展示的是在差异表达上调蛋白和下调蛋白GO各二级功能的蛋白富集情况,体现两个调节方向下各二级功能的地位,具有明显比例差异的二级功能说明差异表达上调蛋白与下调蛋白的富集趋势不同,可以重点分析此功能是否与差异相关。
2. GO levels分类统计图
根据不同levels中GO节点注释到的蛋白数量,选择排名前20个GO节点进行展示,如图所示:
图2 蛋白质在不同level中的注释结果统计图
注:横坐标是富集到蛋白的百分比,纵坐标是按层级从小到大排列。不同level用不同的颜色显示,每个柱子后面的数字是该分类中的蛋白数量。
3. topGO 蛋白质富集分析
百泰派克采用topGO对差异表达蛋白进行富集分析,可以得到差异表达蛋白在GO节点中的富集显著性。并对显著富集的节点在GO体系中的层级关系以有向无环图的形式进行直观展示。topGO有向无环图能直观展示差异表达基因富集的GO节点(Term)及其层级关系,是差异表达基因GO富集分析的结果图形化展示,分支代表包含关系,从上至下所定义的功能描述范围越来越具体。在有向无环图中,箭头代表包含关系,即该节点的所有基因同样注释到其上级节点中。
差异表达蛋白的topGO分子功能有向无环图如下:
图3 差异表达蛋白topGO富集有向无环图(分子功能)
注:对每个GO节点进行富集,在图中用方框表示显著度高的10个节点,图中还包含其各层对应关系。每个方框(或椭圆)内给出了该GO节点的内容描述和富集显著性值。不同颜色代表不同的富集显著性,颜色越深,显著性越高。
How to order?