基因注释和功能分类(3)

直接注释一组基因的结果是得到大量的功能节点。这些功能在概念上重叠,导致分析结果冗余,不利于进一步的细化分析。因此,研究者希望对获得的功能节点进行过滤和筛选,以获得更有意义的功能信息。

富集分析法通常是分析一组基因在某个功能节点是否过度表达。这个原理可以从单个基因的注释分析发展到大基因组的分组分析。

由于分析的结论是基于一组相关基因,而不是单个基因,富集分析方法增加了研究的可靠性,也可以识别与生物现象最相关的生物过程。

常用的功能丰富的网站有agrigo和David。

这里以目前广泛使用的DAVID为例,详细分析一下基因集。DAVID是一个全面的工具,不仅提供基因富集分析,还提供基因之间的ID转换和基因功能的分类。

1.差异表达基因的功能预测。

在基因芯片的数据分析中,研究人员可以找出哪些差异表达的基因属于GO功能的同一个分支,用统计学方法检验结果是否具有统计学意义,从而找出差异表达的基因主要参与了哪些生物学功能。

路径分析是现在经常使用的一种芯片数据的基因功能分析方法。与GO分类(利用单个基因的GO分类信息)不同,通路分析所利用的资源是许多已经研究清楚的基因之间的相互作用,即生物通路。研究人员可以将表达发生变化的基因集合导入到通路分析软件中,然后得到发生变化的基因存在于哪些已知通路中,通过统计方法计算出哪些通路与基因表达的变化最相关。