计算机方向详解 · 知识图谱 / RAG

知识图谱 / GraphRAG:让检索增强不只找相似文本,还能理解关系

传统 RAG 往往按文本相似度取片段,GraphRAG 则尝试先抽取实体和关系,构建知识图谱,再结合社区摘要、图遍历和结构证据回答问题。它适合做知识库问答、企业文档助手、论文阅读系统、导师信息检索和行业知识图谱。

核心数据文档、实体、关系、段落、知识图谱、社区摘要
常见任务实体抽取、关系抽取、图谱构建、GraphRAG 问答、证据溯源
常用方法NER、Relation Extraction、Embedding、GraphRAG、Neo4j
适合人群想做 RAG 系统、知识库、论文助手和行业问答的同学
科研方向库/计算机 / 人工智能/Knowledge Graph / GraphRAG
方向导读

方向理解:先知道它到底在做什么

知识图谱 / GraphRAG 研究如何把文档、实体、关系和社区结构组织成图,再让大模型基于结构化知识做检索、问答、总结和推理。

GraphRAG 的本质:把零散文本变成可遍历的关系网络

普通 RAG 更像在文档里找相似段落,知识图谱/RAG 则先识别实体、关系和主题社区,让模型能沿着关系链寻找证据。

这个方向很适合学生做项目,因为它既能做工程系统,也能做研究问题:图谱构建是否准确、关系检索是否减少幻觉、图结构在什么时候优于普通 RAG。

  • 输入通常是 PDF、网页、企业文档、论文库或导师主页。
  • 输出可以是实体关系图、证据链、问答结果、摘要或知识库系统。
  • 难点在于抽取错误会被放大、图谱构建成本高、时效性和评测都不简单。

中文链路图:把方向拆成输入、模型、任务和成果

任务地图

任务地图:别只背方向名,要看输入输出

一个方向能不能做成项目,关键看它能不能落到明确任务、评价指标和实验数据。

任务地图:适合小白先判断项目切入点

01

实体抽取

从文档中抽取人物、机构、论文、方法、疾病、材料等实体。

输入文本 / PDF / 网页
输出实体列表
科研价值:图谱构建的第一步。
02

关系抽取

判断实体之间的从属、引用、作用、因果或协作关系。

输入实体 + 上下文
输出关系三元组
科研价值:决定图谱是否能推理。
03

知识图谱构建

把零散知识组织成节点和边,支持搜索、统计和展示。

输入实体关系三元组
输出图数据库 / 可视化图
科研价值:适合做可展示系统。
04

GraphRAG 问答

结合图结构和原文证据回答复杂问题。

输入问题 + 图谱 + 文档
输出带证据答案
科研价值:和 AI Agent、RAG 自然衔接。
05

社区摘要

把大规模图谱聚成社区,生成层级摘要。

输入知识图谱社区
输出主题摘要
科研价值:适合做长文档和企业知识库。
06

GraphRAG 评测

比较普通 RAG 和 GraphRAG 在不同问题上的收益。

输入问答集 + 检索证据
输出准确率和溯源报告
科研价值:容易形成论文问题。
技术路线

技术路线:从经典方法到现在的热点

技术路线不是模型名清单,而是看这个方向的问题意识如何一步步变化。

技术路线图:帮助学生看懂方法演进

阶段 01

传统知识图谱

先做实体识别、关系抽取和图数据库存储。

NERRENeo4j
阶段 02

向量检索 RAG

用 embedding 和向量库把相关文档片段接给大模型。

EmbeddingVector DBRAG
阶段 03

GraphRAG 与社区摘要

把文档组织成图,利用社区结构和图遍历增强问答。

GraphRAGCommunityTraversal
阶段 04

Agentic GraphRAG

让 Agent 动态选择图查询、文本检索、工具调用和证据验证。

AgentCypherEvidence
论文清单

经典论文阅读清单

这不是让你背论文名,而是按时间线建立路线感:先看每篇论文解决了什么问题,再看图里哪一块最关键,最后知道它适合放进什么项目里。

KG Survey

Knowledge Graphs

为什么重要:系统介绍知识图谱的表示、构建和应用,是理解 KG/RAG 的基础。

新手读法:重点看实体、关系、schema 和图查询如何组成知识系统。

打开论文 / 来源
2018知识图谱综述看图重点:知识如何被组织成节点、边和模式
RAG

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

为什么重要:RAG 把检索和生成结合,是所有知识库问答项目的基础论文。

新手读法:重点看检索器、生成器和证据文档如何配合。

打开论文 / 来源
2020RAG 奠基看图重点:检索文档如何增强生成答案
GraphRAG

A Graph RAG Approach to Query-Focused Summarization

为什么重要:提出基于图和社区摘要的 GraphRAG 方案,适合理解长文档和全局问题问答。

新手读法:重点看实体关系抽取、社区检测和 query-focused summarization。

打开论文 / 来源
2024GraphRAG 方法看图重点:文档如何变成图,再服务全局问答
Graph + RAG

Retrieval-Augmented Generation with Graphs (GraphRAG)

为什么重要:系统整理 GraphRAG 的任务、方法、应用和挑战,是后续选题的重要入口。

新手读法:重点看图检索、图学习、图遍历和普通 RAG 的差异。

打开论文 / 来源
2025GraphRAG 综述看图重点:图结构如何增强 RAG 的关系推理
评价指标

评价指标:怎么证明项目真的有效

不同任务不能只看 Accuracy。论文和项目都要说明指标为什么适合当前问题。

Entity F1

实体抽取是否准确。

Relation F1

关系抽取和三元组构建是否正确。

Retrieval Recall

检索到的证据是否覆盖正确答案。

Answer Faithfulness

答案是否忠实于检索证据。

Graph Quality

图谱是否重复、断裂、边类型混乱。

Latency / Cost

GraphRAG 构图和查询成本通常高于普通 RAG。

数据工具

数据集和工具:先看有没有公开入口

小白选题时先确认数据、代码和 benchmark 是否可获得,否则方向再热也很难落地。

导师翻译

导师主页方向翻译:这些词到底暗示什么

学生看老师主页最难的是不知道关键词背后对应什么任务和能力要求。

Knowledge Graph

把实体和关系组织成图,支持查询和推理。

RAG

把外部文档检索结果接给大模型,减少幻觉。

GraphRAG

用图结构、社区摘要和关系检索增强 RAG。

Entity Linking

把文本里的实体对齐到知识库节点。

Evidence Chain

回答问题时给出可追溯证据链。

Graph Database

用 Neo4j、ArangoDB 等存储和查询关系网络。

入门路径

入门路径:从小项目走到研究点

真正适合学生的路线,是先跑通最小闭环,再逐步加难度。

第 1 阶段:做普通 RAG

先把 PDF 或网页接入向量库,完成带证据问答。

第 2 阶段:抽取实体关系

从文档中抽取实体、关系和三元组,构建知识图谱。

第 3 阶段:加入图查询

让系统能用图遍历、社区摘要和原文证据回答问题。

第 4 阶段:比较 GraphRAG 和 RAG

设计问答集,评估哪些问题图结构真的有帮助。

项目选题

项目选题:能写进简历和申请材料

下面这些题目不是空泛口号,而是可以沉淀代码、实验结果、图表和论文雏形的方向。

导师主页知识图谱

抽取导师、论文、方向、学校和项目关系,支持检索和推荐。

论文阅读 GraphRAG

把论文中的方法、数据集、指标和结论建成图谱。

企业制度问答系统

用 GraphRAG 回答跨部门、跨文件的制度问题。

医学指南知识图谱

抽取疾病、症状、检查、药物和治疗关系。

GraphRAG 评测平台

比较相似度检索、图检索和混合检索的问答效果。

知识图谱可视化工具

把实体关系图做成可交互页面,支持点击查看证据。

常见问题

常见问题:小白最容易卡住的判断

这部分覆盖搜索和咨询时最高频的问题。

GraphRAG 一定比普通 RAG 好吗?

不一定。它更适合关系复杂、全局总结、多跳证据问题;简单事实问答可能普通 RAG 更快。

小白能做知识图谱吗?

可以,从一个小文档集合开始抽实体和关系,不要一开始做大规模开放图谱。

这个方向适合非计算机专业吗?

适合。法律、医学、教育、金融都有大量结构化知识和文档问答需求。

继续探索适合你的科研方向

这个方向只是计算机科研路线中的一个入口。你也可以继续查看多模态学习、世界模型、推荐系统、可信 AI 等方向,再结合自己的专业基础、目标导师和时间周期选择更合适的切入点。