GNN 的本质:一个样本不是孤立的,它和周围对象有关系
传统机器学习常把每个样本当作独立行,但很多真实数据不是这样:用户连接商品,论文引用论文,道路连接道路,分子由原子和化学键组成。
图神经网络通过消息传递让节点吸收邻居信息,再完成节点、边或整图级任务。它的科研价值在于把“关系结构”变成模型可以学习的信号。
- 输入通常是图结构:节点、边、节点特征、边特征和标签。
- 输出可以是节点类别、链接概率、整图类别、推荐分数或未来流量。
- 难点在于过平滑、异质图、动态图、可解释性和大规模训练。
图神经网络研究的是关系数据:节点、边、属性和结构如何共同决定预测结果,例如社交网络、推荐系统、分子结构、交通路网和知识图谱。
传统机器学习常把每个样本当作独立行,但很多真实数据不是这样:用户连接商品,论文引用论文,道路连接道路,分子由原子和化学键组成。
图神经网络通过消息传递让节点吸收邻居信息,再完成节点、边或整图级任务。它的科研价值在于把“关系结构”变成模型可以学习的信号。
中文链路图:把方向拆成输入、模型、任务和成果
一个方向能不能做成项目,关键看它能不能落到明确任务、评价指标和实验数据。
任务地图:适合小白先判断项目切入点
预测用户、论文、疾病、账号或网页属于哪一类。
预测用户是否会购买商品、药物是否作用于蛋白、两人是否可能连接。
判断分子性质、脑网络类型、程序结构或社交子图模式。
利用用户和物品之间的交互图增强推荐系统。
在道路节点间传播时空信息,预测交通变化。
找出影响预测的结构证据。
技术路线不是模型名清单,而是看这个方向的问题意识如何一步步变化。
技术路线图:帮助学生看懂方法演进
把卷积推广到图结构,建立半监督节点分类经典范式。
GraphSAGE 通过邻居采样和聚合处理新节点和大图。
GAT 学习邻居权重,GIN 讨论 GNN 区分图结构的能力上限。
面向复杂关系、时间变化和长距离依赖,GNN 与 Transformer、预训练结合。
这不是让你背论文名,而是按时间线建立路线感:先看每篇论文解决了什么问题,再看图里哪一块最关键,最后知道它适合放进什么项目里。
为什么重要:GCN 是图神经网络入门必读论文,把图卷积用于半监督节点分类。
新手读法:重点看邻接矩阵归一化和两层 GCN 如何传播邻居信息。
打开论文 / 来源为什么重要:GraphSAGE 解决新节点和大规模图上的归纳表示学习问题。
新手读法:重点看邻居采样、聚合函数和 inductive setting。
打开论文 / 来源为什么重要:GAT 让模型学习不同邻居的重要性,是图注意力机制代表。
新手读法:重点看 attention coefficient 如何替代固定邻接权重。
打开论文 / 来源为什么重要:GIN 从理论上讨论 GNN 表达能力,是理解图分类和模型上限的重要论文。
新手读法:重点看 WL test 和 sum aggregation 为什么重要。
打开论文 / 来源不同任务不能只看 Accuracy。论文和项目都要说明指标为什么适合当前问题。
节点分类和图分类基础指标。
链接预测和边预测常用。
图推荐任务常用。
交通流量和时序图预测常用。
大图训练速度、显存和采样效率。
图解释是否真的影响模型预测。
小白选题时先确认数据、代码和 benchmark 是否可获得,否则方向再热也很难落地。
学生看老师主页最难的是不知道关键词背后对应什么任务和能力要求。
学习节点、边或图的向量表示。
偏实体关系、知识推理和检索增强。
多类型节点和多类型边,例如用户-商品-商家。
图结构或节点特征随时间变化。
把原子和化学键建成图,用于药物和材料。
解释 GNN 判断依赖哪些节点、边和子结构。
真正适合学生的路线,是先跑通最小闭环,再逐步加难度。
用 Cora 或 PubMed 学会图数据格式和消息传递。
比较采样、注意力和不同聚合方式的效果。
做推荐、交通、分子或金融风控中的图任务。
围绕动态图、异质图、可解释性、鲁棒性或图预训练设计实验。
下面这些题目不是空泛口号,而是可以沉淀代码、实验结果、图表和论文雏形的方向。
用 GCN/GAT 对论文节点分类并可视化邻居影响。
构建二部图并用 LightGCN/GNN 做推荐。
把分子转成图,预测毒性、溶解度或活性。
用路网图和历史流量预测未来拥堵。
用账号、设备、交易关系构图检测异常。
用子图解释模型为什么判断某节点或分子为正类。
这部分覆盖搜索和咨询时最高频的问题。
相比大模型热度下降了一些,但在分子、推荐、交通、知识图谱等关系数据场景仍然很重要。
概念比普通分类复杂,但用 PyG/DGL 跑 Cora、OGB 入门并不难。
适合金融风控、药物发现、交通、推荐系统、社会网络、脑网络和知识图谱。
这个方向只是计算机科研路线中的一个入口。你也可以继续查看多模态学习、世界模型、推荐系统、可信 AI 等方向,再结合自己的专业基础、目标导师和时间周期选择更合适的切入点。