基因共表达网络(gene correlation network,GCN)
基因共表达网络是一种无向图,每个节点代表基因,如果二者存在明显的共表达关系,就用一个边连接两个节点。对不同的样本或者不同的实验条件建立基因表达谱后,可以通过查看不同样本间产生相似表达模式的基因对建立基因共表达网络。原因是,两个共表达基因在不同的样本中应以相同模式变化。共同表达的基因是由同一转录控制程序控制、功能相关、同一通路或蛋白结构的组成部分,所以基因共表达网络具有生物学意义。

基因共表达网络不指定共表达关系的方向和类型。然而在基因调控网络中,边是有方向的,代表着反应、变换、互作、激活或者抑制的生化过程。而基因共表达网络并不尝试判定因果关系,边只代表基因之间的相关或者依赖关系。有类似功能或参与统一生物功能的基因会产生很多相互作用,在基因共表达网络中会体现为模块或连接丰富的子图。

基因共表达网络中忽略边的方向。虽然三个基因X、Y、Z共同表达,并无法确定是谁激活谁。
基因共表达网络一般是用高通量基因表达谱技术(如微阵列和RNA测序)生成的数据集建立的。

构建共表达网络

研究人员为构建基因共表达网络开发了不少方法。根本上,他们都分两步:计算共表达指标、选择显著阈值。首先,选择共表达指标,之后用这个指标计算每一对基因之间的相似分数。之后,确定阈值,将高于阈值认定为具有显著的共表达关系,用边在网络中连接。

通常用矩阵表示构建基因共表达网络的输入数据。如果我们有n个样本m个基因的表达值,输入数据就会是m×n矩阵(称作表达矩阵)。比如,一个微阵列实验中,测量各级各样本的几千个基因的表达值。第一步,先对表达矩阵每两行计算相似分数(共表达指标)。之后的矩阵就会是一个m×m矩阵,称作相似矩阵。这个矩阵的每个元素都是有关两个基因共同改变幅度大小的。之后,将相关矩阵中每个高于特定阈值的指标都替换成1,其他的替换成0。此时的矩阵成为邻接矩阵,代表所创建的基因共表达网络的图。此矩阵中,每个元素都显示两个基因是否在网络中相互连接。

[FROM WIKIPEDIA]