计算机方向详解 · 自动驾驶 AI

自动驾驶 AI:从感知到预测再到规划控制

自动驾驶 AI 不是单个检测模型,而是摄像头、激光雷达、BEV 表示、轨迹预测、规划控制和安全评测组成的闭环系统。学生项目要明确做感知、预测、规划还是端到端驾驶。

核心数据相机、激光雷达、毫米波雷达、BEV 标注和轨迹数据
常见任务3D 检测、BEV 感知、轨迹预测、端到端驾驶
常用方法BEV 感知、轨迹预测、规划控制、端到端驾驶
适合人群适合自动驾驶、机器人感知和多传感器融合方向的同学
方向导读

方向理解:先知道它到底在做什么

研究车辆如何感知环境、预测交通参与者、规划轨迹并安全执行。

自动驾驶 AI的本质:先把方向翻译成任务闭环

自动驾驶 AI不是只背一个热门名词,而是要看它处理什么数据、解决什么任务、用什么指标证明有效。

学生入门时最重要的是先跑通最小闭环:明确输入输出,复现一个 baseline,再围绕数据、模型、评价或项目化展示做改进。

  • 输入通常来自计算机 / 自动驾驶 / 感知决策相关数据或公开 benchmark。
  • 输出必须能被指标评估,不能只停留在概念介绍。
  • 项目价值来自可复现结果、可视化分析和清楚的误差讨论。

中文链路图:把方向拆成输入、模型、任务和成果

任务地图

任务地图:别只背方向名,要看输入输出

一个方向能不能做成项目,关键看它能不能落到明确任务、评价指标和实验数据。

任务地图:适合小白先判断项目切入点

01

三维目标检测

识别车辆、行人、自行车等交通参与者。

输入相机/雷达/激光雷达
输出3D 框和类别
科研价值:自动驾驶感知核心任务。
02

BEV 感知

把环视图像融合到统一俯视空间。

输入多摄像头图像
输出鸟瞰语义图
科研价值:贴近 BEVFormer 等代表工作。
03

车道线与地图

理解道路结构和可行驶区域。

输入相机图像、地图先验
输出车道、边界、拓扑
科研价值:适合做可视化结果。
04

轨迹预测

预测周围车辆和行人会怎么走。

输入历史位置、交互关系
输出未来轨迹分布
科研价值:连接安全决策。
05

规划与控制

把感知结果转成车辆动作。

输入感知结果、目标点
输出行驶轨迹和控制量
科研价值:体现端到端自动驾驶。
06

闭环仿真评测

在仿真中评估规划系统。

输入场景、策略、交通规则
输出碰撞率、舒适性、到达率
科研价值:适合工程化项目。
技术路线

技术路线:从经典方法到现在的热点

技术路线不是模型名清单,而是看这个方向的问题意识如何一步步变化。

技术路线图:帮助学生看懂方法演进

阶段 01

点云与多传感器感知

从点云、相机和雷达中提取空间目标。

PointNetLiDAR3D Detection
阶段 02

开放数据集和基准

用统一数据和指标推动算法比较。

WaymonuScenesBenchmark
阶段 03

BEV 统一表示

把多摄像头视角投到鸟瞰空间。

BEVFormerView TransformOccupancy
阶段 04

感知预测规划一体化

端到端连接多任务并考虑驾驶闭环。

UniADPlanningEnd-to-end
论文清单

经典论文阅读清单

这不是让你背论文名,而是按时间线建立路线感:先看每篇论文解决了什么问题,再看图里哪一块最关键,最后知道它适合放进什么项目里。

PointNet

PointNet

为什么重要:PointNet 是这个方向的代表工作,适合用来理解具体任务、核心方法和实验指标。

新手读法:重点看它的输入输出、核心模块、评价指标和失败案例,而不是只背论文标题。

打开论文 / 来源
2019经典方法看图重点:PointNet 的核心流程如何从输入走到实验结果
Waymo Open Dataset

Waymo Open Dataset

为什么重要:Waymo Open Dataset 是这个方向的代表工作,适合用来理解具体任务、核心方法和实验指标。

新手读法:重点看它的输入输出、核心模块、评价指标和失败案例,而不是只背论文标题。

打开论文 / 来源
2021代表论文看图重点:Waymo Open Dataset 的核心流程如何从输入走到实验结果
BEVFormer

BEVFormer

为什么重要:BEVFormer 是这个方向的代表工作,适合用来理解具体任务、核心方法和实验指标。

新手读法:重点看它的输入输出、核心模块、评价指标和失败案例,而不是只背论文标题。

打开论文 / 来源
2023前沿论文看图重点:BEVFormer 的核心流程如何从输入走到实验结果
UniAD

UniAD

为什么重要:UniAD 是这个方向的代表工作,适合用来理解具体任务、核心方法和实验指标。

新手读法:重点看它的输入输出、核心模块、评价指标和失败案例,而不是只背论文标题。

打开论文 / 来源
2025综述/趋势看图重点:UniAD 的核心流程如何从输入走到实验结果
评价指标

评价指标:怎么证明项目真的有效

不同任务不能只看 Accuracy。论文和项目都要说明指标为什么适合当前问题。

mAP / NDS

自动驾驶检测和感知评测常用。

ADE / FDE

轨迹预测平均和最终位移误差。

Planning Collision Rate

规划轨迹是否碰撞或违反规则。

Lane / BEV IoU

车道线、占用栅格和 BEV 任务指标。

Latency

在线驾驶系统的实时性。

Safety Score

综合安全、舒适性和规则遵守表现。

数据工具

数据集和工具:先看有没有公开入口

小白选题时先确认数据、代码和 benchmark 是否可获得,否则方向再热也很难落地。

导师翻译

导师主页方向翻译:这些词到底暗示什么

学生看老师主页最难的是不知道关键词背后对应什么任务和能力要求。

PointNet

通常对应 PointNet 相关任务、数据集、指标和实现路线。

Waymo Open Dataset

通常对应 Waymo Open Dataset 相关任务、数据集、指标和实现路线。

BEVFormer

通常对应 BEVFormer 相关任务、数据集、指标和实现路线。

UniAD

通常对应 UniAD 相关任务、数据集、指标和实现路线。

入门路径

入门路径:从小项目走到研究点

真正适合学生的路线,是先跑通最小闭环,再逐步加难度。

第 1 阶段:先做感知任务

从目标检测、车道线或 BEV 分割入门。

第 2 阶段:加入轨迹预测

评估 ADE/FDE 和场景交互。

第 3 阶段:理解规划闭环

把预测结果接到规划或风险评分。

第 4 阶段:做安全分析

输出碰撞率、延迟和失败场景报告。

项目选题

项目选题:能写进简历和申请材料

下面这些题目不是空泛口号,而是可以沉淀代码、实验结果、图表和论文雏形的方向。

BEV 目标检测入门

用公开数据做车辆和行人检测。

轨迹预测可视化

预测未来轨迹并分析失败场景。

感知到规划风险评分

把检测结果转成碰撞风险或规则风险。

自动驾驶数据质检工具

找遮挡、雨夜、长尾场景等困难样本。

常见问题

常见问题:小白最容易卡住的判断

这部分覆盖搜索和咨询时最高频的问题。

没有车载数据能做吗?

可以用 Waymo、nuScenes、KITTI 等公开数据做感知和预测。

项目最该展示什么?

多传感器输入、BEV 可视化、检测/预测结果和指标。

自动驾驶方向会不会太大?

要缩小到一个任务,比如 BEV 感知、轨迹预测或闭环仿真评测。

继续探索适合你的科研方向

这个方向只是计算机科研路线中的一个入口。你也可以继续查看多模态学习、世界模型、推荐系统、可信 AI 等方向,再结合自己的专业基础、目标导师和时间周期选择更合适的切入点。