同质图与异质图 | Homogeneous Graph & Heterogeneous Graph
一、同质图(Homogeneous Graph)
定义:
图中所有节点属于同一类型,所有边也属于同一类型,是最基础的图结构。
数学表示:
$\mathcal{G} = (\mathcal{V}, \mathcal{E})$
- $\mathcal{V}$: 单一类型节点集合
- $\mathcal{E} \subseteq \mathcal{V} \times \mathcal{V}$: 单一类型边集合
典型特征:
graph LR
A[用户1] --好友--> B[用户2]
A --好友--> C[用户3]
B --好友--> D[用户4]
C --好友--> D
- 节点同质:所有节点表示相同实体(如用户、论文)
- 边同质:所有边表示相同关系(如好友、引用)
- 邻接矩阵对称:若图无向,则 $\mathbf{A} = \mathbf{A}^\top$
应用场景:
- 社交网络(Facebook好友关系)
- 引用网络(arXiv论文互引)
- 分子结构(原子间化学键)
二、异质图(Heterogeneous Graph)
定义:
包含多种节点类型和/或多种边类型,能建模更复杂的现实关系。
数学表示:
$\mathcal{G} = (\mathcal{V}, \mathcal{E}, \mathcal{T}_v, \mathcal{T}_e, \phi, \psi)$
- $\mathcal{T}_v$: 节点类型集合($|\mathcal{T}_v| > 1$)
- $\mathcal{T}_e$: 边类型集合($|\mathcal{T}_e| > 1$)
- $\phi: \mathcal{V} \to \mathcal{T}_v$: 节点类型映射函数
- $\psi: \mathcal{E} \to \mathcal{T}_e$: 边类型映射函数
典型特征:
graph LR
A[作者] --撰写--> B[论文]
B --发表于--> C[会议]
B --引用--> D[论文]
D --主题属于--> E[领域]
- 节点异构:多种类型节点(作者/论文/会议/领域)
- 边异构:多种语义关系(撰写/发表/引用/属于)
- 邻接张量:需使用三维张量 $\mathbf{A}^{(r)}$ 表示关系 $r$
应用场景:
- 学术网络(DBLP, AMiner)
- 电商系统(用户-商品-店铺)
- 知识图谱(实体-关系-实体)
三、核心区别对比
| 特性 | 同质图 | 异质图 | ||||
|---|---|---|---|---|---|---|
| 节点类型 | 单一类型($\ | \mathcal{T}_v\ | =1$) | 多种类型($\ | \mathcal{T}_v\ | ≥2$) |
| 边类型 | 单一关系($\ | \mathcal{T}_e\ | =1$) | 多种关系($\ | \mathcal{T}_e\ | ≥2$) |
| 邻接结构 | 二维矩阵 $\mathbf{A}$ | 三维张量 $\mathbf{A}^{(r)}$ | ||||
| 语义信息 | 低 | 高(边类型携带丰富语义) | ||||
| 建模复杂度 | 低 | 高 |
四、异构图核心概念:元路径(Meta-Path)
作用:捕捉跨类型的语义关系链
定义:节点类型序列 $T1 \xrightarrow{R_1} T_2 \xrightarrow{R_2} … \xrightarrow{R_k} T{k+1}$
示例:
- APA:作者 $\xrightarrow{发表}$ 论文 $\xrightarrow{被引用}$ 作者(合作者关系)
- AVF:作者 $\xrightarrow{工作于}$ 机构 $\xrightarrow{位于}$ 城市(地域关联)
数学表示:
元路径邻接矩阵:
其中是关系 $R_i$ 的邻接矩阵
五、建模方法对比
| 方法类型 | 同质图模型 | 异质图模型 |
|---|---|---|
| 基础模型 | GCN, GAT, GraphSAGE | R-GCN, HAN, HGT |
| 邻接处理 | 单一 $\mathbf{A}$ | 分关系处理 $\mathbf{A}^{(r)}$ |
| 聚合策略 | 邻居均值/最大值 | 按关系类型分组聚合 |
| 新SOTA模型 | GCNII, GPR-GNN | MAGNN, GTN (KDD 2023) |
六、异构图建模实战(PyG代码)
1 | import torch |
七、学术前沿进展 (2023-2024)
动态异构图:
- DyHGN (KDD 2023):建模时序依赖的异构图神经网络
- 适用场景:金融风控、社交网络演化分析
自监督异构图学习:
- HeCo (WWW 2023):通过跨类型对比学习
1
loss = -log(exp(sim(z_a, z_p)/τ) / ∑_{z_n} exp(sim(z_a, z_n)/τ))
- 创新点:避免负采样偏差,处理长尾分布
- HeCo (WWW 2023):通过跨类型对比学习
超图拓展:
- HNHN (NeurIPS 2023):异质超图神经网络
- 典型应用:药物组合效应预测
最新工具推荐:
- PyG 2.4+ 内置
HeteroData和HGTConv- DGL 1.1+ 支持元路径随机游走
- OpenHGNN (清华大学):专为异构图设计的工具库
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 EpsilonZ's Blog!
