计算机方向详解 · GNN

图神经网络 GNN:研究关系数据里的 AI

GNN 的优势是跨专业能力很强:金融风控、药物发现、交通预测、推荐系统、社交网络、脑网络都能做。它适合想做“AI + 关系数据”科研项目的同学。

核心数据节点、边、属性、关系、子图和动态图
常见任务节点分类、链接预测、图分类、图推荐、交通预测
常用方法GCN、GraphSAGE、GAT、GIN、Graph Transformer
适合人群喜欢网络关系、结构建模、推荐或 AI for Science 的同学
方向导读

方向理解:先知道它到底在做什么

图神经网络研究的是关系数据:节点、边、属性和结构如何共同决定预测结果,例如社交网络、推荐系统、分子结构、交通路网和知识图谱。

GNN 的本质:一个样本不是孤立的,它和周围对象有关系

传统机器学习常把每个样本当作独立行,但很多真实数据不是这样:用户连接商品,论文引用论文,道路连接道路,分子由原子和化学键组成。

图神经网络通过消息传递让节点吸收邻居信息,再完成节点、边或整图级任务。它的科研价值在于把“关系结构”变成模型可以学习的信号。

  • 输入通常是图结构:节点、边、节点特征、边特征和标签。
  • 输出可以是节点类别、链接概率、整图类别、推荐分数或未来流量。
  • 难点在于过平滑、异质图、动态图、可解释性和大规模训练。

中文链路图:把方向拆成输入、模型、任务和成果

任务地图

任务地图:别只背方向名,要看输入输出

一个方向能不能做成项目,关键看它能不能落到明确任务、评价指标和实验数据。

任务地图:适合小白先判断项目切入点

01

节点分类

预测用户、论文、疾病、账号或网页属于哪一类。

输入图 + 节点特征
输出节点类别
科研价值:GNN 最经典入门任务。
02

链接预测

预测用户是否会购买商品、药物是否作用于蛋白、两人是否可能连接。

输入已有边 + 节点表示
输出潜在关系概率
科研价值:适合推荐、金融和生物交叉。
03

图分类

判断分子性质、脑网络类型、程序结构或社交子图模式。

输入一个图
输出图级标签
科研价值:AI for Science 常见任务。
04

图推荐

利用用户和物品之间的交互图增强推荐系统。

输入用户-物品二部图
输出推荐分数
科研价值:和推荐系统自然结合。
05

交通预测

在道路节点间传播时空信息,预测交通变化。

输入路网图 + 时序流量
输出未来流量 / 拥堵
科研价值:适合城市计算和交通专业。
06

图解释

找出影响预测的结构证据。

输入GNN 预测结果
输出关键节点 / 边 / 子图
科研价值:和可信 AI 结合,适合论文创新。
技术路线

技术路线:从经典方法到现在的热点

技术路线不是模型名清单,而是看这个方向的问题意识如何一步步变化。

技术路线图:帮助学生看懂方法演进

阶段 01

谱图卷积与 GCN

把卷积推广到图结构,建立半监督节点分类经典范式。

GCNspectralmessage passing
阶段 02

归纳学习与采样

GraphSAGE 通过邻居采样和聚合处理新节点和大图。

GraphSAGEsamplinginductive
阶段 03

注意力与表达能力

GAT 学习邻居权重,GIN 讨论 GNN 区分图结构的能力上限。

GATGINattention
阶段 04

异质图、动态图和图 Transformer

面向复杂关系、时间变化和长距离依赖,GNN 与 Transformer、预训练结合。

heterogeneoustemporalGraph Transformer
论文清单

经典论文阅读清单

这不是让你背论文名,而是按时间线建立路线感:先看每篇论文解决了什么问题,再看图里哪一块最关键,最后知道它适合放进什么项目里。

GCN

Semi-Supervised Classification with Graph Convolutional Networks

为什么重要:GCN 是图神经网络入门必读论文,把图卷积用于半监督节点分类。

新手读法:重点看邻接矩阵归一化和两层 GCN 如何传播邻居信息。

打开论文 / 来源
2016奠基论文看图重点:节点如何从邻居那里聚合信息
GraphSAGE

Inductive Representation Learning on Large Graphs

为什么重要:GraphSAGE 解决新节点和大规模图上的归纳表示学习问题。

新手读法:重点看邻居采样、聚合函数和 inductive setting。

打开论文 / 来源
2017归纳学习看图重点:大图上如何采样邻居并学习新节点表示
GAT

Graph Attention Networks

为什么重要:GAT 让模型学习不同邻居的重要性,是图注意力机制代表。

新手读法:重点看 attention coefficient 如何替代固定邻接权重。

打开论文 / 来源
2017注意力机制看图重点:模型如何判断哪个邻居更重要
GIN

How Powerful are Graph Neural Networks?

为什么重要:GIN 从理论上讨论 GNN 表达能力,是理解图分类和模型上限的重要论文。

新手读法:重点看 WL test 和 sum aggregation 为什么重要。

打开论文 / 来源
2018表达能力看图重点:不同聚合方式会影响 GNN 能分清哪些图
评价指标

评价指标:怎么证明项目真的有效

不同任务不能只看 Accuracy。论文和项目都要说明指标为什么适合当前问题。

Accuracy / F1

节点分类和图分类基础指标。

AUC / AP

链接预测和边预测常用。

Recall@K / NDCG

图推荐任务常用。

MAE / RMSE

交通流量和时序图预测常用。

Scalability

大图训练速度、显存和采样效率。

Explanation Fidelity

图解释是否真的影响模型预测。

数据工具

数据集和工具:先看有没有公开入口

小白选题时先确认数据、代码和 benchmark 是否可获得,否则方向再热也很难落地。

导师翻译

导师主页方向翻译:这些词到底暗示什么

学生看老师主页最难的是不知道关键词背后对应什么任务和能力要求。

Graph Representation Learning

学习节点、边或图的向量表示。

Knowledge Graph

偏实体关系、知识推理和检索增强。

Heterogeneous Graph

多类型节点和多类型边,例如用户-商品-商家。

Temporal Graph

图结构或节点特征随时间变化。

Molecular Graph

把原子和化学键建成图,用于药物和材料。

Graph Explainability

解释 GNN 判断依赖哪些节点、边和子结构。

入门路径

入门路径:从小项目走到研究点

真正适合学生的路线,是先跑通最小闭环,再逐步加难度。

第 1 阶段:跑通 GCN 节点分类

用 Cora 或 PubMed 学会图数据格式和消息传递。

第 2 阶段:尝试 GraphSAGE / GAT

比较采样、注意力和不同聚合方式的效果。

第 3 阶段:换成真实场景

做推荐、交通、分子或金融风控中的图任务。

第 4 阶段:加入研究点

围绕动态图、异质图、可解释性、鲁棒性或图预训练设计实验。

项目选题

项目选题:能写进简历和申请材料

下面这些题目不是空泛口号,而是可以沉淀代码、实验结果、图表和论文雏形的方向。

论文引用网络分类

用 GCN/GAT 对论文节点分类并可视化邻居影响。

用户-商品图推荐

构建二部图并用 LightGCN/GNN 做推荐。

分子性质预测

把分子转成图,预测毒性、溶解度或活性。

交通流量预测

用路网图和历史流量预测未来拥堵。

金融欺诈图检测

用账号、设备、交易关系构图检测异常。

GNN 可解释性分析

用子图解释模型为什么判断某节点或分子为正类。

常见问题

常见问题:小白最容易卡住的判断

这部分覆盖搜索和咨询时最高频的问题。

GNN 现在还热门吗?

相比大模型热度下降了一些,但在分子、推荐、交通、知识图谱等关系数据场景仍然很重要。

GNN 难不难入门?

概念比普通分类复杂,但用 PyG/DGL 跑 Cora、OGB 入门并不难。

GNN 适合哪些专业交叉?

适合金融风控、药物发现、交通、推荐系统、社会网络、脑网络和知识图谱。

继续探索适合你的科研方向

这个方向只是计算机科研路线中的一个入口。你也可以继续查看多模态学习、世界模型、推荐系统、可信 AI 等方向,再结合自己的专业基础、目标导师和时间周期选择更合适的切入点。