掌握Agentic RAG：大模型检索进阶实践，小白也能轻松收藏学习！

张开发

• 2026/6/6 10:36:48 • 15 分钟阅读

分享文章

掌握Agentic RAG大模型检索进阶实践小白也能轻松收藏学习本文深入解析了Agentic RAG架构如何通过智能代理能力、动态任务规划和多步骤推理超越传统RAG的被动模式实现复杂问题的自主拆解与精准回答。以DeepSearcher为例展示了其如何利用Milvus向量数据库接入私有知识并通过迭代反馈机制提升检索效果特别适用于综述类和复杂推理类提问。文章还对比了Agentic RAG与普通RAG、Graph RAG及Deep Research的优劣指出传统RAG的局限性及Agentic RAG作为未来趋势的必然性并强调了学习大模型AI的重要性与紧迫性。1 、开篇Agentic RAG为何能取代传统RAG如果要给DeepSearcher一个精准定位它正是当前大模型落地领域最热门的Agentic RAG架构的典型实践。对于刚接触大模型检索的开发者来说先搞懂这个核心概念很关键——Agentic RAG本质是融合了智能代理Agent能力的进阶版RAG架构通过动态任务规划、多步骤推理和自主决策机制实现了检索-加工-验证-优化的闭环流程。这种架构的崛起核心驱动力是大模型推理能力的爆发式提升。对比传统RAG的一问一答被动模式Agentic RAG更像一个有独立思考能力的助手能主动将复杂问题拆解为多个子问题通过多轮查询迭代优化最终输出精准结果。具体来说Agentic RAG相比传统RAG有三大核心升级这也是它能成为未来趋势的关键响应模式从被动等待查询升级为主动拆解任务无需用户细化提问就能精准定位需求检索能力从单次关键词匹配升级为多轮动态调整自我修正减少检索遗漏与误差适用场景从简单事实问答拓展到复杂推理深度报告生成覆盖更多企业级开放域任务。基于这些升级DeepSearcher能像人类专家一样不仅给出问题答案还能同步输出推理过程和执行细节。对开发者而言这意味着大模型检索从能回答迈向了会思考。长期来看Agentic RAG取代传统RAG是必然趋势一方面传统RAG的语义理解停留在基础层面另一方面现实中大部分需求都藏着隐含逻辑比如如何基于公司财报生成年度分析报告必须通过推理-反思-迭代-优化的流程才能拆解到位。2、DeepSearcher 的架构设计一个通往搜索AGI的Agentic RAG应该如何设计从架构上看DeepSearcher 主要分为两大模块。一个是数据接入模块通过Milvus向量数据库来接入各种第三方的私有知识。这也是DeepSearcher相比OpenAI的原本DeepResearch做出的一大重大升级——更适合拥有独家数据的企业级场景。另外一部分是在线推理查询模块。这个模块包括了各种Agent策略以及RAG的实现部分负责给用户提供准确有深度的回答。这部分引入了动态循环迭代机制**** 每次对向量数据库中内容完成数据查询后系统都会启动一个反馈reflection流程然后在每一轮迭代结束时智能体Agent会对查询到的知识进行评估判断其是否足以解答初始提出的问题。若发现仍存在知识缺口便会触发下一轮迭代查询若判定已有足够知识来作答系统就会生成最终报告。这种不断“追问”“反思”的能力其实也是Agentic RAG相比传统RAG的最大进步甚至也是人类的文学、历史、哲学、科学千年来不断进步的根源所在。3、Deep Searcher的效果到底如何适合哪些场景我们可以看到DeepSearcher 在完成安装并导入本地文件后针对我们的 query 命令会对所有导入的内容进行深度搜索和分析在搜索过程中会打印每一步的搜索过程和思考过程并对结果进行最后的整合。相应的这种相对**“重思考”“重算力投入”**的模式在落地中更适合“综述类提问”以及“含复杂推理类提问”的场景。1综述类提问综述类提问的典型代表是写报告写文档写总结它一般会给出一个简短的主题但要求尽可能多的给出详尽汇报输出。我们以“How has The Simpsons changed over time?”(《辛普森一家》动画剧集随着时间的推移发生了什么变化)为例在Deep Searcher第一轮生成的初始子查询如下文所示Break down the original query into new sub queries: [ How has the cultural impact and societal relevance of The Simpsons evolved from its debut to the present?, What changes in character development, humor, and storytelling styles have occurred across different seasons of The Simpsons?, How has the animation style and production technology of The Simpsons changed over time?, How have audience demographics, reception, and ratings of The Simpsons shifted throughout its run?]在经过检索信息反馈迭代后又生成下一轮的子查询问题New search queries for next iteration: [ How have changes in The Simpsons voice cast and production team influenced the shows evolution over different seasons?, What role has The Simpsons satire and social commentary played in its adaptation to contemporary issues across decades?, How has The Simpsons addressed and incorporated shifts in media consumption, such as streaming services, into its distribution and content strategies?]每一轮的子问题都回到知识库里面检索生成最后完整的报告**Report: The Evolution of _The Simpsons_ (1989–Present)** **1. Cultural Impact and Societal Relevance** _The Simpsons_ debuted as a subversive critique of American middle-class life, gaining notoriety for its bold satire in the 1990s. Initially a countercultural phenomenon, it challenged norms with episodes tackling religion, politics, and consumerism. Over time, its cultural dominance waned as competitors like _South Park_ and _Family Guy_ pushed boundaries further. By the 2010s, the show transitioned from trendsetter to nostalgic institution, balancing legacy appeal with attempts to address modern issues like climate change and LGBTQ rights, albeit with less societal resonance. **2. Character Development and Storytelling Shifts** Early seasons featured nuanced character arcs (e.g., Lisa’s activism, Marge’s resilience), but later seasons saw Flanderization (exaggerating traits, e.g., Homer’s stupidity, Ned Flanders’ piety). Humor evolved from witty, character-driven satire to reliance on pop culture references and meta-humor. Serialized storytelling in early episodes gave way to episodic, gag-focused plots, often sacrificing emotional depth for absurdity. [...] **12. Merchandising and Global Reach** The 1990s merchandise boom (action figures, _Simpsons_-themed cereals) faded, but the franchise persists via collaborations (e.g., _Fortnite_ skins, Lego sets). International adaptations include localized dubbing and culturally tailored episodes (e.g., Japanese _Itchy Scratchy_ variants). **Conclusion** _The Simpsons_ evolved from a radical satire to a television institution, navigating shifts in technology, politics, and audience expectations. While its golden-age brilliance remains unmatched, its adaptability—through streaming, updated humor, and global outreach—secures its place as a cultural touchstone. The show’s longevity reflects both nostalgia and a pragmatic embrace of change, even as it grapples with the challenges of relevance in a fragmented media landscape.2含复杂推理类提问含复杂推理类提问通常在提问中包含着隐含着复杂的逻辑推理比如问谁的七大姑八大姨家的小孩上学的班级的班主任名字。这类问题往往存在多个实体关系或者逻辑之间的连接需要多次反馈迭代查询。我们以问题“Which film has the director who is older, God’S Gift To Women or Aldri annet enn bråk.”哪部电影的导演年龄更大是《God’S Gift To Women》还是《Aldri annet enn bråk》为例。对人类来说这个问题可能很基础。但对传统RAG来说这显然这是个复杂的问题因为我们的知识库并不会存储这个问题的直接答案。因此我们需要先检索到两部电影的导演的信息然后找到他们的出生日期最后再比较哪个年纪大。Deep Searcher的搜索过程如下系统针对拆解后的子问题[Who is the director of GodS Gift To Women?, Who is the director of Aldri annet enn bråk?, What are the ages of the respective directors?, Which director is older?]然后第一次迭代找到The director of Gods Gift To Women is Michael Curtiz, the director of Aldri annet enn bråk is Edith Carlmar定位到两部电影的导演的名字。第二轮的子查询包括[Find the birthdate of Michael Curtiz, the director of Gods Gift To Women, Find the birthdate of Edith Carlmar, the director of Aldri annet enn bråk]然后搜索到两位导演的出生年月最后得到正确的回答。The director of Gods Gift To Women is Michael Curtiz, who was born on December 24, 1886 and passed away on April 11, 1962. He was a Hungarian-born American film director known for his prolific career in Hollywood. On the other hand, the director of Aldri annet enn bråk is Edith Carlmar, who was born on November 15, 1911 and passed away on May 17, 2003. Therefore, Michael Curtiz is older than Edith Carlmar.而反观普通RAG的回答效果1. **Aldri annet enn bråk** (1954) is directed by **Edith Carlmar**, who was born on November 15, 1911. 2. The related chunks did not provide specific details about the director of Gods Gift to Women. However, if we look at external sources for Gods Gift to Women, the film was directed by **L. M. (Lyman) Steinberg**, who was born on December 19, 1905. By comparing their birth dates: - Edith Carlmar: November 15, 1911 - L. M. Steinberg: December 19, 1905 **Conclusion**: L. M. Steinberg, the director of Gods Gift to Women, is older than Edith Carlmar, the director of Aldri annet enn bråk.由于一次性检索的内容不足检索到的电影《God’s Gift to Women》的导演无法推断此时LLM幻觉猜测是另外一名导演这直接导致错误的回答。4、Deep Searcher VS 普通RAG 定量对比在GitHub的Deep Searcher官方代码库里我们已经提供了定量测试的代码。在本文中我们以 2WikiMultiHopQA 这个常见的数据集测试。由于测试需要消耗大量API token这里只测试前50条数据和全量数据测试相比会有一些抖动误差但大致可以反映和说明问题。1和普通RAG的召回率效果对比以Max Iterations最大反馈迭代为横轴以Recall召回率为纵轴下图是Deep Searcher 的召回率和普通RAG召回率的对比。可以看到随着Max Iterations最大反馈迭代次数变多Deep Searcher 召回效果越来越好。但也可以看到随着迭代次数慢慢增加边际收益越来越少说明反馈次数增加后可能会达到一定的上限继续反馈可能不太能得到更好的效果因此我们默认迭代次数为3您可以根据自身的需求进行调整。2token的消耗量我们以迭代次数为横轴50次总的token消耗为纵轴绘制出下图很明显可以看到随着迭代次数的提高我们可以看到Deep Searcher 的token的消耗是线性地提升。如果按照4次来算大约0.3M的token消耗如果粗略按照OpenAI的gpt-4o-mini单价0.60$/1M output token来算平均每次查询大约是0.18 / 50 0.0036美元的费用消耗。如果换做推理模型这个费用应该会数倍增加包括推理模型本身的单价更贵以及推理模型的输出token量会更多。3模型间的对比相比OpenAI官方推出的DeepResearch我们推出的 Deep Searcher 的另一大特点是可以自由切换模型。在这里我们也对各种不同的推理模型、非推理模型如(gpt-4o-mini)进行了测试。可以看到Claude 3.7 Sonnet的效果最好不过也领先的也不多。当然因为我们的测试样本量不多所以每次测试的结果可能会有一些偏差。但总体上看推理模型是比非推理模型强的。另外在我们的测试中更弱更小的的非推理模型有时由于指令跟随能力太弱无法完成整个 agent 查询流程所以也无法完成整个测试这个也是不少开发者在部署类似产品时经常会遇到的一个问题。5、Deep Searcher VS Graph RAGDeep Searcher的本质是Agentic RAG和Graph RAG有着很明显的区别。Graph RAG主要聚焦于对存在连接关系的文档展开查询在处理多跳类问题上表现出色。例如当导入一部长篇小说时它能够精准抽取各个人物之间错综复杂的关系。其运作方式是在文档导入环节就对实体间关系进行抽取。因此这一过程会大量消耗大模型的token资源。而在查询阶段不论是否是查询图中某些节点的信息都会进行图结构的搜索这使得这一框架不太灵活。反观Agentic RAG它的资源消耗模式与Graph RAG恰好相反。在数据导入阶段Agentic RAG无需执行额外特殊操作而在回答用户提问时才会产生较多大模型的token消耗。从查询模式的灵活性角度对比Graph RAG存在明显短板它的查询模式较为固定通常仅适用于单一关系的查询难以根据多样化的需求进行灵活调整。而Agentic RAG则展现出强大的灵活性。Deep Searcher在不论是类似探究“A、B和C之间存在何种关系”这样复杂的逻辑问题亦或是撰写各类专业报告等任务都能在查询阶段依据问题的特性灵活调整路由策略进行反复的反馈迭代思考从而给出最为精准、全面的回答。未来随着大模型成本持续降低推理性能稳步提升像Deep Searcher这样的Agentic RAG凭借其突出的灵活性与适应性极有可能在未来成为主流技术并在实际应用场景中实现深度落地。但这并不意味着全盘否定Graph RAG类产品由于其在调整方面存在一定难度后续或许更多地作为一个基础组件融入到更为复杂的技术体系中与其他技术协同发挥作用。6、Deep Searcher VS Deep Research与OpenAI的Deep Research不同Deep Searcher着重聚焦于对私有数据的深度检索与理解。借助向量数据库Deep Searcher能够接入多样化的数据源整合不同类型的数据并将其统一存储于向量数据库的知识库中。凭借向量数据库强大的语义搜索功能Deep Searcher可实现对海量离线数据的语义搜索。另一方面Deep Searcher是一个完全开源的产品。毋庸置疑OpenAI的Deep Research在内容生成质量上依然在业内处于领先地位但对企业用户来说每个账户除了需要每月需支付200美元之外闭源的服务也就意味着其内部流程对用户而言是未知的。而Deep Searcher所有内部流程都是开源的用户能够清晰了解其中的细节并基于开源代码进行定制或者将其部署到生产环境中。一些思考与经验分享在整个项目的研发以及后续迭代过程中我们有一些经验与心得分享推理模型很好但绝非万能。我们通过实验发现推理模型做 agent 虽然效果好但有时也会对一些简单的指令判断做一大堆分析与反复思考确认不仅消耗过多token回答速度还慢。这也印证了诸如 OpenAI 的大模型厂商后续不再区别推理和非推理模型背后的逻辑模型服务应该自动根据需求判断是否推理以节省不必要的 token 开销。Agentic RAG 的爆发尽在眼前。从需求侧看深度内容生成是一个刚需场景技术侧来看提升RAG效果也是刚需。长期来看影响Agentic RAG 爆发的唯一阻碍就是成本但是随着DeepSeek R1这样的低成本高质量LLM出现以及摩尔定律推动的芯片降本推理服务的成本也会变得越来越低。Agentic RAG 也存在隐形的scaling law “墙”。实验中面对一些复杂问题我们一度尝试通过增加 token 数量来优化效果。但最终发现随着 token 数量的增加边际收益递减的现象逐渐显现到了一定阶段即便投入更多 token 进行反思和迭代效果也难以得到进一步提升。传统RAG已死传统RAG的优势在于一次检索的低成本。但其对需求的响应还停留在非常基础语义理解-检索的阶段但现实中我们大部分的需求表达背后都是有隐含逻辑的并不能被一步检索到位比如如何在一年赚一个亿必须通过推理-反思-迭代-优化来对其进行拆解与反馈而以Deep Searcher为代表的Agentic RAG 技术方向将是无可置疑的大势所趋。最后近期科技圈传来重磅消息行业巨头英特尔宣布大规模裁员2万人传统技术岗位持续萎缩的同时另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式据行业招聘数据显示具备3-5年大模型相关经验的开发者在大厂就能拿到50K×20薪的高薪待遇薪资差距肉眼可见业内资深HR预判不出1年“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下“温水煮青蛙”式的等待只会让自己逐渐被淘汰与其被动应对不如主动出击抢先掌握AI大模型核心原理落地应用技术项目实操经验借行业风口实现职业翻盘深知技术人入门大模型时容易走弯路我特意整理了一套全网最全最细的大模型零基础学习礼包涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费免费分享给所有想入局AI大模型的朋友扫码免费领取全部内容部分资料展示1、 AI大模型学习路线图2、全套AI大模型应用开发视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、大模型学习书籍文档4、AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、大模型大厂面试真题整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题涵盖基础理论、技术实操、项目经验等维度每道题都配有详细解析和答题思路帮你针对性提升面试竞争力。6、大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。扫码免费领取全部内容这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

掌握Agentic RAG：大模型检索进阶实践，小白也能轻松收藏学习！

最新文章

NVIDIA DGX SuperPOD：AI超级工厂的算力革命

STC8H8K64U单片机内存布局保姆级图解：从code区到EEPROM，新手避坑指南

TVA技术在能源行业的应用综述

python jwt

保姆级教程：在粤嵌GEC6818上搞定GY-39传感器数据采集（附完整源码）

Android音频启动流程避坑指南：AudioPolicyService与AudioFlinger的交互核心loadHwModule与openOutput详解

推荐文章

相关文章

分享文章

更多文章

当产品页面开始自动“说话”：用 AI 将静态信息转化为持续流量的实战观察

革新性插件加载器：MelonLoader重塑Unity游戏扩展生态

Android Kotlin实战项目：从新手到专家的50个实战案例全解析

每日一书⑩ | AI 未来：未来不属于 AI，属于会用 AI 的人

Apache SeaTunnel .. 重磅发布！最值得关注的 Top 功能更新

从能用到性能: gcsfuse 中`CreateEmptyFile` 配置项的设计演进分析

【MicroPython编程-ESP32篇:设备驱动】-PCF8591数据采集驱动

OpenClaw日志分析技巧：快速定位Kimi-VL-A3B-Thinking多模态任务失败原因

电子电气架构 --- 复杂的汽车软件追溯（上）

【花雕学编程】行空板K10+嵌入式MimiClaw：技术适配深度解析，解锁低成本嵌入式AI落地密码

EdgeRemover终极指南：2025年安全卸载Microsoft Edge的完整解决方案

消息队列实战：推拉模式选型与性能优化指南