11-15 | AI智能体训练营第二期
知识库×记忆:打造Bot专属"最强大脑"
📅 2025年11月15日 19:55-23:18 第五课
课程核心:RAG与记忆优化
知识库和长期记忆的双引擎驱动

本课程以北京旅游小助手为实战案例,聚焦知识库RAG记忆机制的深度应用。通过上传多格式知识库(文本、表格、图片等)并进行分段处理,结合系统变量、用户变量和长期记忆配置,显著提升智能体的准确性与个性化服务能力。

关键技术栈包括:向量数据库转换、数据清洗增强、模型微调参数调整。通过知识库检索增强生成(RAG)解决智能体幻觉问题,通过结构化数据库自动保存用户交互数据,实现真正的"记忆"功能。

数据处理全链路
从收集到优化的完整工程化方案

数据收集困难:企业数据格式多样化、员工提供意愿低等现实挑战。

数据清洗:去除特殊字符、敏感信息、重复数据,可利用阿里百炼、百度千帆、火山方舟等平台自动化处理。

数据增强:使模糊概念更明确,提高大模型理解和采用概率。数据集用于模型训练微调,如特定风格模型需提供对应对话数据集。

向量转换:文本→向量数据库,通过embedding模型支持,提高检索效率和可视化理解。

AI火种车:科技赋能乡村教育
将AI带到没有去到的地方

社区启动"AI火种车"计划,10位来自学术界、硬件、AI智能体、数学教育、视频艺术等多领域的专家组成团队,奔赴云南西南联大举行启动仪式。

参与老师包括丫丫(教育版主、一线教师)、Zima(硬件大神)、冯明孝(核物理背景硬件AI结合)、郝德宏(前腾讯云架构师)、季贤(前阿里设计师)、薇娜(AI大客户培训经验丰富)、阿木(AI视频艺术家)、可怡(直播负责人)、黄冰(云南本地AI基地教学老师)。

目标是让当地小朋友和教师接触新技术,口号"去AI没有去到的地方,让爱洒满全世界",号召更多人加入。

"一枚扣子"展示了优秀学员笔记,强调这些笔记具有"从0到1的价值,包含思考和总结",对学习有巨大帮助。同时建议使用工作流实现作业,避免过度依赖自主规划模式以确保精准度。

— 课程讲师指导

✨ 智能体的"最强大脑"=优化的知识库+精细化记忆+自动化数据处理。从被动幻觉到主动记忆,从通用模型到领域专精,通过RAG+微调+变量系统的组合拳,打造真正理解用户、记住用户的AI助手。

5大关键收获
  1. 知识库是解决幻觉的一级方案:通过上传北京烤鸭、北京大学等领域文档,配合提示词强制调用,让智能体基于事实回答而非生成幻觉
  2. 记忆分三层:变量→长期记忆→数据库:系统/用户变量记录基础信息,长期记忆保存对话历史和偏好,结构化数据库自动记录景点消费等具体数据
  3. 数据工程是必修课:收集→清洗→增强→向量化,利用百炼/千帆/方舟等平台自动化处理,是大模型应用的工程化基础
  4. 工作流优于自主规划:作业实现建议用工作流替代自主规划模式,提升精准度和可控性,多练习RAG部分内容
  5. 优秀笔记的"从0到1价值":完成作业后记录思考过程,形成体系化笔记,这比单纯完成作业本身更具学习和参考价值