字节 AI agent 一面面试题

张开发

• 2026/5/31 7:01:58 • 15 分钟阅读

分享文章

Q多模态大模型的具体结构是什么(1)视觉编码器 Vision Encoder )以 CLIP ViT / SigLIP / EVA - CLIP 为主图像分为 patch 序列提取视觉特征通常使用预训练权重冻结或部分微调。现代方案如Qwen2.5- VL 用2D- RoPE 替代绝对位置编码支持原生动态分辨率和任意宽高比。(2)适配器 Adapter / Connector )连接视觉特征与 LLM 输入空间三种主流方案( a )线性 MLP ( LLaVA 、Qwen2- VL )-简单高效训练稳定2025年主流( b ) Q - Former ( BLIP -2)–32个可学习 query 压缩视觉 token 降低 LLM 计算量但训练难度高( c ) Perceiver Resampler ( Flamingo )-长度表示。(3语言模型 LLM )接受拼接后的「视觉 token 文本 token 」自回归生成。训练分阶段 Stage 1冻结 LLM 只训 Adapter 建立视觉语言语义对齐, Stage 2 LoRA 或全参微调 LLM 提升指令遵循和对话能力。AQ多模态的用户信息怎么存储和使用根据个人项目经历作答。涉及用户画像 KV 存储、历史对话向量库、多模态内容图像 Embedding 元数据的组合存储与检索策略。AQRAG系统流程(1离线建库文档清洗→切分512 token / chunk , overlap 50-100 token )→ Embedding 模型编码 BGE /E5)→存入向量库 FAISS / Milvus )附带文档来源、时间戳等元数据。(2在线检索 Query Embedding → ANN 检索 Top - K →可选混合检索向量BM25, RRF 融合→ Cross - Encoder Reranker 精排取 Top - N 。(3增强生成将检索文档拼接到 Prompt → LLM 生成答案可选引用来源标注。AQLoRA的原理和 QLoRA 的原理 QLoRA 怎么优化显存(1) LoRA 原理对预训练权重 W 添加旁路△ W BA ( BER ( dxr ), AER ( rxk ), r min ( d , k ))冻结 W 只训练 B 和 A 。可训练参数从 dk 降至 r ( d k )。 A 用高斯初始化 B 用零初始化保证训练初始△ W 0)。推理时 W W BA 合并无额外延迟。 r 通常取8-64。(2) QLoRA 三招组合①基础模型用4- bit NormalFloat (NF4量化存储显存减少约75%; LoRA 旁路参数和梯度保持BF16高精度保证训练稳定性不能量化梯度计算路径;③分页优化器 Paged Optimizer )优化器状态溢出时自动页换到 CPU 内存消除 GPU 显存峰值尖刺使单卡可训练65B模型。(3三者对比 LoRA ≈节省3x显存主要省优化器状态; QLoRA ≈节省10x显存激进量化基础模型; QLoRA 训练速度略慢于 LoRA 量化反量化开销。AQAI辅助开发的实践经验主观类问题根据个人实践经历作答。AQ觉得当前的 agent 达到预期了吗对 agent 的预期是什么主观类问题根据个人观点和项目经验作答。AQ怎么进行多模态知识检索(1跨模态 Embedding 检索用 CLIP 、 SigLIP 等图文共享编码器将图像和文本映射到同一向量空间图像库预先编码为 image embedding 存入向量库 Milvus / Qdrant )检索时用文本 query 的 embedding 做相似度搜索实现「以文搜图」或「以图搜图」。(2混合增强对图像生成结构化文本描述 Caption OCR 也建文本索引支持关键词向量混合检索 RRF 融合多模态 Reranker 对结果重排提升精度。(3注意事项纯文本语义检索不应用 CLIP 改用 BGE /E5精度高得多多模态 RAG 才需要 CLIP 类跨模态模型 Milvus / Qdrant 支持向量元数据联合索引实现时间类别过滤。AQA2A与 MCP 区别(1) MCP ( Model Context Protocol )定位为 Al 的 USB - C 接口规范 LLM 与外部工具数据源文件系统、数据库、 API 的调用协议三层能力暴露 Resources 数据访问、 Tools 可执行操作、 Prompts 模板基于 JSON - RPC 支持stdio / HTTP / WebSocket 传输核心价值一个 MCP Server 可被所有支持 MCP 的模型复用消除碎片化集成。(2)A2A( Agent - to - Agent Protocol ): Google 于2025年4月发布2025年6月贡献 Linux Foundation 管理已获150组织支持基于 HTTP JSON - RPC 2.0 SSE ,通过. well - known / agent . json 的 Agent Cards 发布智能体能力支持自然语言任务委派、多模态流式传输、 OAuth 2.0/OIDC认证解决跨厂商 Agent 互操作问题一个 Agent 可以把子任务委托给另一个 Agent 完成。(3核心区别 MCP Agent 调用工具纵向模型→工具工具是被动服务方;A2A Agent 委托 Agent 横向智能体→智能体双方都是主动决策者。同一系统可同时使用用 MCP 连接工具用A2A协调多 Agent 分工。AQ较长较多的上下文怎么解决(1位置编码扩展训练侧: YaRN 通过非均匀 RoPE 插值在少量长文本数据上 continual pretraining 即可从4K扩展到128K(Qwen2.5、 LLaMA -3.1标配核心技巧是调大 RoPE basefrequency (10000→500000再加长文本训练 LongRoPE ( Microsoft ,2024进一步将 Phi -3扩展到2M token 仅需1K步 fine - tune 。(2稀疏注意力架构侧滑动窗口 Attention ( Mistral )只做局部计算 O ( n 复杂度 Dual Chunk Attention (Qwen2分块做局部跨块全局 Attention ; StreamingLLM 保留初始 token 滑窗实现理论无限长度推理。(3) KV Cache 压缩推理侧: GQA / MQA 减少 KV 头数直接降低 KV Cache 大小 MLA ( DeepSeek -V2/V3低维投影压缩 KV 至1/8尺寸H2O驱逐不重要 KV 只保留20%关键 token ; PagedAttention ( vLLM 消除碎片化提升内存利用率。(4) RAG 替代超长上下文知识密集型任务中检索相关片段比塞满上下文通常更精准且成本低研究表明超长上下文存在 lost in the middle 中间位置内容注意力弱于头尾。AQAgent项目开发的框架(1) LangChain 生态最广数百个工具集成提供 Tool / Chain / Memory / Agent 模块适合快速原型和单 Agent 流程缺点是抽象层多、调试复杂不适合复杂状态管理。(2) LangGraph : LangChain 团队出品用有向图表达 Agent 状态机节点动作边条件转移天然支持循环条件分支人机交互节点是2025年构建 production - ready Agent 的主流选择适合复杂的 Agentic 工作流。(3) Llamalndex 以 RAG 数据 pipeline 为核心加载切分索引检索, Agent 能力相对弱知识密集型 Agent 文档问答、知识库搜索首选。(4) AutoGen ( Microsoft )/ CrewAl 多 Agent 协作框架。 AutoGen 基于对话式 Agent 互动内置代码执行沙箱人类代理适合代码生成研究助手 CrewAI 用角色化分工( Role / Goal / Backstory )适合流程化多角色协作任务。(5低代码平台 Dify 等可视化编排内置 RAG MCP 集成适合业务快速交付不适合深度定制。这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容