智能体的本质:把“语言理解”接到“外部行动”
普通聊天模型主要生成回答,AI Agent 则要把回答变成行动。它需要知道目标是什么、任务如何拆、什么时候搜索、什么时候写代码、什么时候调用数据库,以及失败后怎样重试。
这类方向适合小白,是因为它天然有系统形态:知识库问答、论文阅读助手、导师信息检索、自动写报告、代码修复、简历优化等,都可以做成能演示的项目。
- 输入通常是用户目标、文档、网页、代码仓库或业务数据。
- 输出不是一句话,而是检索证据、执行步骤、生成文件、修改代码或完成流程。
- 难点在于可靠性:Agent 很容易幻觉、误调用工具、陷入循环或无法判断任务是否完成。