企业知识库问答系统的详细架构图

张开发
2026/4/21 0:25:48 15 分钟阅读

分享文章

企业知识库问答系统的详细架构图
离线链路把企业知识加工进知识库- 在线链路用户提问后检索、推理、生成答案总架构图──离线建库链路───────────────────────────────────数据源Confluence / SharePoint / 钉盘 / 飞书文档 / Git / Wiki / PDF / Word / 工单 / FAQ|v连接器 Connector|v文档预处理格式解析 / OCR / 去重 / 清洗 / 分段 Chunk / 标题层级抽取 / 表格处理 / 图片说明抽取|v元数据与权限绑定部门 / 系统 / 文档类型 / 更新时间 / 作者 / ACL / 标签|v向量化与索引Embedding / 倒排索引 / 向量索引 / 多路索引 / 增量更新|v知识库存储Object Storage Metadata DB Search Engine Vector DB在线问答链路1. 用户提问2. 身份认证与权限校验3. Query Router 判断问题类型4. 问题改写与上下文补全5. 检索策略选择- FAQ直答- 关键词检索- 向量检索- 混合检索- 指定知识域过滤6. 召回候选文档7. Reranker 重排8. 上下文组装9. LLM 生成答案10. 引用来源与置信度输出11. 安全审查与脱敏12. 返回答案并记录反馈关键模块说明接入层- 面向员工、客服、研发、运营提供统一入口。- 支持网页、IM 机器人、内部平台嵌入、API 调用。网关层- 做认证、单点登录、租户隔离、限流、审计。- 企业系统里这层不能省否则后面权限会失控。问答编排层- 这是总控层不直接回答问题。- 负责决定走 FAQ、RAG、结构化查询还是转人工。- 负责多轮会话状态、异常兜底、超时和重试。RAG 检索层- 企业知识问答的核心。- 一般不是只做向量检索而是 BM25 Vector Metadata Filter Rerank。- 最终把最相关、且用户有权限看的材料拼给模型。模型服务层- LLM 负责生成答案。- Embedding 负责把文档和问题变成向量。- Reranker 负责精排。- 有时还会有小模型做意图识别、敏感分类、语言检测。工具服务层- 对接组织、工单、数据库、流程系统。- 如果用户问的是“查状态、查数据”可能不该只靠知识库而要走工具查询。数据服务层- Object Storage 存原文。- Metadata DB 存标题、作者、权限、更新时间等结构化信息。- Search Engine 做关键词检索。- Vector DB 做语义检索。- Cache 提升热点问题性能。治理层- 负责观测、评测、安全、成本、审计。- 真正上线后治理层和问答能力本身一样重要。知识入库的详细处理原始文档- 解析格式- OCR/表格抽取/图片说明- 清洗噪音- 语义分段- 补充标题层级- 提取元数据- 绑定ACL权限- 生成向量- 建立倒排索引- 写入向量库与搜索引擎- 触发增量更新这里最容易做坏的有三个点- 分段 Chunk 不合理太短会丢上下文太长会降低召回质量。- 权限 ACL 没绑定会出现“检索结果越权”。- 增量更新 不完善文档更新了答案还是老的。一个比较稳的检索策略企业里通常不要只用单一路径推荐- 第一层FAQ 精准命中- 第二层关键词召回- 第三层向量召回- 第四层按部门、系统、时间、标签做过滤- 第五层Rerank 重排- 第六层上下文压缩后喂给 LLM这比“直接向量检索 大模型回答”稳得多。答案输出建议一个企业级答案最好不只是自然语言还应包含- 答案正文- 引用来源- 引用片段- 文档更新时间- 置信度/命中说明- 相关问题推荐- 无答案时的兜底建议这样用户更容易信任系统。权限设计必须单独强调知识库问答里最危险的问题不是“答错”而是“答了不该答的”。所以权限控制至少要做到- 用户只能检索到自己有权限的文档- 引用来源也必须走 ACL 校验- 多租户数据必须隔离- 脱敏信息不能原样进入模型上下文- 审计日志要能追踪“谁问了什么、系统引用了什么”推荐的技术分层思路- 主干Workflow / Query Router- 检索Hybrid RAG- 生成LLM- 排序Reranker- 权限ACL Service- 治理Tracing Eval Safety Audit上线时的 MVP 版本如果你先做第一版不要一口气做太大建议最小闭环是1. 接一个文档源2. 做基础解析和分段3. 建向量库和关键词索引4. 做权限过滤5. 做混合检索6. 接一个 LLM 生成答案7. 返回引用来源8. 加日志、反馈和人工兜底这已经能做出一个可用版本。一句总结企业知识库问答系统的核心不是“接一个大模型”而是用离线建库把企业知识加工干净用在线 RAG 把正确资料在正确权限下找出来再由模型生成带引用、可审计、可治理的答案。

更多文章