计算机方向详解 · 推荐系统

推荐系统:把合适的内容推荐给合适的人

推荐系统是最适合学生做项目的 AI 方向之一,因为它有清晰数据、明确指标和强业务场景。它既能做互联网求职项目,也能和教育、金融、医疗、新闻传播、知识服务结合。

核心数据用户、物品、点击、收藏、购买、评分、文本图像特征
常见任务召回、排序、CTR 预估、序列推荐、冷启动
常用方法协同过滤、Embedding、DIN、SASRec、BERT4Rec
适合人群想做能跑通、能量化、能展示业务价值项目的同学
方向导读

方向理解:先知道它到底在做什么

推荐系统研究如何利用用户行为、物品内容、上下文和反馈,把合适的商品、视频、论文、课程或服务推荐给合适的人。

推荐系统的本质:从“用户可能喜欢什么”变成可计算任务

推荐系统不是简单猜你喜欢,而是把用户、物品和上下文转成向量、特征和序列,再通过召回、排序和重排一步步筛选。

它很适合小白做科研项目,因为可以从公开数据集入手,快速形成完整闭环:数据处理、模型训练、指标评估、可视化和推荐解释。

  • 输入通常是用户行为日志、物品属性、文本图像内容和上下文特征。
  • 输出可以是点击概率、 Top-K 推荐列表、排序分数或个性化解释。
  • 难点在于数据稀疏、冷启动、实时性、多目标平衡和推荐公平性。

中文链路图:把方向拆成输入、模型、任务和成果

任务地图

任务地图:别只背方向名,要看输入输出

一个方向能不能做成项目,关键看它能不能落到明确任务、评价指标和实验数据。

任务地图:适合小白先判断项目切入点

01

协同过滤

根据相似用户或相似物品判断用户可能喜欢什么。

输入用户-物品交互矩阵
输出推荐列表
科研价值:推荐系统最经典入口。
02

CTR 预估

预测用户是否点击广告、商品、视频或课程。

输入用户、物品、上下文特征
输出点击概率
科研价值:工业界最常见任务。
03

序列推荐

用最近浏览、购买或点击顺序预测下一步兴趣。

输入用户历史行为序列
输出下一物品预测
科研价值:适合 Transformer 和大模型结合。
04

多模态推荐

把商品图片、视频封面、标题描述等内容接入推荐。

输入图片 + 文本 + 行为
输出个性化推荐
科研价值:和多模态方向自然交叉。
05

冷启动推荐

解决没有历史行为时怎么推荐的问题。

输入新用户 / 新物品少量信息
输出初始推荐
科研价值:真实业务痛点强。
06

推荐公平与多样性

避免只推热门内容、信息茧房或群体曝光不公平。

输入推荐列表 + 群体/内容属性
输出公平性和多样性指标
科研价值:适合和可信 AI 结合。
技术路线

技术路线:从经典方法到现在的热点

技术路线不是模型名清单,而是看这个方向的问题意识如何一步步变化。

技术路线图:帮助学生看懂方法演进

阶段 01

矩阵分解与协同过滤

把用户和物品映射到隐向量空间,用内积预测偏好。

MFBPRimplicit feedback
阶段 02

深度推荐与特征交叉

用 Embedding、MLP、Wide&Deep、DIN 等方法处理稀疏特征。

NCFDINDeepFM
阶段 03

序列推荐和注意力机制

用 RNN/Transformer 建模用户兴趣随时间变化。

SASRecBERT4RecTransformer
阶段 04

推荐大模型与多模态推荐

把 LLM、图文特征和用户行为结合,做解释、对话和生成式推荐。

LLMRecmultimodalconversational rec
论文清单

经典论文阅读清单

这不是让你背论文名,而是按时间线建立路线感:先看每篇论文解决了什么问题,再看图里哪一块最关键,最后知道它适合放进什么项目里。

NCF

Neural Collaborative Filtering

为什么重要:用神经网络替代传统内积建模用户-物品交互,是深度推荐入门论文。

新手读法:重点看 GMF、MLP 和 NeuMF 如何组合。

打开论文 / 来源
2017深度推荐看图重点:用户和物品如何从传统内积走向神经网络交互
DIN

Deep Interest Network for Click-Through Rate Prediction

为什么重要:DIN 用注意力从用户历史行为中提取当前广告相关兴趣,是 CTR 预估经典模型。

新手读法:重点看 activation unit 如何针对候选物品动态提取兴趣。

打开论文 / 来源
2018工业模型看图重点:候选物品如何激活用户历史兴趣
SASRec

Self-Attentive Sequential Recommendation

为什么重要:把自注意力引入序列推荐,是理解 Transformer 推荐的重要入口。

新手读法:重点看用户行为序列如何被 mask self-attention 建模。

打开论文 / 来源
2018序列推荐看图重点:自注意力如何理解用户行为序列
BERT4Rec

BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations

为什么重要:把 BERT 式双向预训练用于序列推荐,连接了推荐系统和大模型预训练范式。

新手读法:重点看 Cloze task 和双向上下文如何改善下一物品预测。

打开论文 / 来源
2019预训练推荐看图重点:BERT 式预训练如何迁移到推荐序列
评价指标

评价指标:怎么证明项目真的有效

不同任务不能只看 Accuracy。论文和项目都要说明指标为什么适合当前问题。

Recall@K

前 K 个推荐里命中真实喜欢物品的比例。

NDCG@K

考虑命中位置,越靠前越好。

AUC

CTR 预估里衡量正负样本排序能力。

CTR / CVR

线上业务指标,点击率和转化率。

Coverage

推荐是否覆盖足够多物品,避免只推热门。

Diversity

推荐列表是否足够多样,减少信息茧房。

数据工具

数据集和工具:先看有没有公开入口

小白选题时先确认数据、代码和 benchmark 是否可获得,否则方向再热也很难落地。

导师翻译

导师主页方向翻译:这些词到底暗示什么

学生看老师主页最难的是不知道关键词背后对应什么任务和能力要求。

CTR Prediction

偏广告、电商点击率预估。

Sequential Recommendation

偏用户行为序列和下一物品预测。

Multi-modal Recommendation

把图片、文本、视频内容引入推荐。

Graph-based Recommendation

利用用户-物品图或社交图增强推荐。

Cold Start

关注新用户或新物品缺少历史的问题。

Fair Recommendation

关注推荐公平、多样性和平台生态。

入门路径

入门路径:从小项目走到研究点

真正适合学生的路线,是先跑通最小闭环,再逐步加难度。

第 1 阶段:跑通 MovieLens baseline

实现协同过滤、矩阵分解或 NCF,掌握 Recall/NDCG。

第 2 阶段:做序列推荐

用 SASRec/BERT4Rec 处理用户行为序列。

第 3 阶段:加入内容或图结构

把文本、图片、用户-物品图接入推荐。

第 4 阶段:收窄研究点

从冷启动、多样性、公平、可解释或 LLM 推荐中选一个问题。

项目选题

项目选题:能写进简历和申请材料

下面这些题目不是空泛口号,而是可以沉淀代码、实验结果、图表和论文雏形的方向。

课程个性化推荐系统

根据学生学习记录推荐课程、题目或复习材料。

论文推荐系统

根据阅读历史和关键词推荐相关论文。

多模态商品推荐

结合商品图像、标题和用户行为做推荐。

短视频序列推荐

用用户观看序列预测下一条视频。

推荐系统公平性分析

评估长尾内容、不同作者或不同群体曝光是否均衡。

对话式推荐助手

用 LLM 解释推荐理由并根据用户反馈调整结果。

常见问题

常见问题:小白最容易卡住的判断

这部分覆盖搜索和咨询时最高频的问题。

推荐系统适合保研项目吗?

适合,因为数据公开、指标明确、项目闭环强,很容易讲清楚动机和结果。

推荐系统是不是过时了?

没有。推荐系统是互联网长期核心方向,只是现在和大模型、多模态、可信 AI 结合更多。

小白从哪个模型开始?

先做 MovieLens + NCF 或 BPR,再进阶到 SASRec/BERT4Rec。

继续探索适合你的科研方向

这个方向只是计算机科研路线中的一个入口。你也可以继续查看多模态学习、世界模型、推荐系统、可信 AI 等方向,再结合自己的专业基础、目标导师和时间周期选择更合适的切入点。