大模型提取结构化JSON——生产级

张开发

• 2026/4/14 8:16:55 • 15 分钟阅读

分享文章

目录输出结构化符合预期的JsonPhase 1: 提示工程约束 (Prompt Engineering)Phase 2: 原生协议控制 (Native Protocol Control)深入浅出：如何用 Function Calling 提取结构化数据第一步：把“提取动作”包装成一个“函数说明 (Schema)”第二步：向大模型发起对话请求第三步：见证奇迹！大模型不再返回普通文本了第四步：在你的代码里直接拿来用总结Phase 3: 解码拦截 - 核心 (Decoding Interception)深入浅出：解码拦截与 Outlines 状态机 (Decoding Interception)一、大白话原理解析：如何“捂住大模型的嘴”？1. 大模型的“打字机”原理2. FSM (有限状态机) 的介入：随身监工二、 Python 代码实战1.使用 Outlines 库2. OpenAI协议自带校验器三、为什么解码拦截（Phase 3）是“终极杀器”？优势 1：100% 的语法正确率优势 2：节省 Token 和算力劣势：Phase 4: 解析自愈与重试 (Parsing Self-healing and Retry)总结输出结构化符合预期的Json四个阶段（Phase 1 - Phase 4）：Phase 1: 提示工程约束 (Prompt Engineering)大白话：在你提问的时候，明明白白地告诉大模型你要什么格式，并且给它打个样。提供 JSON Schema：把上面 Pydantic 定义的类转换成 JSON 结构说明（Schema）丢给大模型。告诉它：“你必须返回包含 name, age, email 的 JSON，age 必须是数字”。Few-shot 示例 (少样本提示)：仅仅说还不够，直接给例子。输入给大模型的 Prompt 示例：提取用户信息。例子1：输入："我是张三，今年25岁，邮箱是zs@qq.com"输出：{"name": "张三", "age": 25, "email": "zs@qq.com"}例子2：输入："李四昨天刚满三十，联系方式lisi@gmail.com"输出：{"name": "李四", "age": 30, "email": "lisi@gmail.com"}现在请处理：输入："老王今年40了，wang@163.com是他的邮箱。"输出：Phase 2: 原生协议控制 (Native Protocol Control)大白话：很多主流大模型（如 OpenAI, Claude, 智谱等）已经在 API 层面提供了强制输出 JSON 的开关，直接把开关打开。JSON Mode:在调用 API 时，直接加上参数response_format={ "type": "json_object" }。这会让大模型在底层偏向于生成合法的 JSON 字符串。Function Calling (工具调用):把你需要的提取动作包装成一个“函数”。大模型不会直接回复文本，而是返回一个调用该函数的指令，里面的参数天然就是结构化好的name,age,email。深入浅出：如何用 Function Calling 提取结构化数据在之前的“四层防御体系”中，我们提到了Phase 2: 原生协议控制里的Function Calling（工具调用）。传统的做法是“求”大模型：“请你输出JSON格式”。而 Function Calling 的逻辑是“骗”大模型：“我现在有一个系统函数，需要你帮我把参数填满，你去调用它。”为了让你直观理解，我们用 OpenAI 的 API 格式（这也是目前行业的通用标准）来模拟这个场景：提取「姓名」、「年龄」和「邮箱」。第一步：把“提取动作”包装成一个“函数说明 (Schema)”在大模型的世界里，你不需要真的写一个能在它那里运行的函数，你只需要告诉它有这个函数存在，以及这个函数需要什么参数。我们定义一个假想的函数叫save_user_profile（保存用户档案）。在传给大模型的 API 时，我们会带上下面这段 JSON 描述（也就是工具箱/Tools）：{ "name": "save_user_profile", "description": "从自然语言文本中提取用户信息，并保存到数据库中。", "parameters": { "type": "object", "properties": { "name": { "type": "string", "description": "用户的姓名，例如：张三、老王" }, "age": { "type": "integer", "description": "用户的年龄，必须是纯数字，例如：40" }, "email": { "type": "string", "description": "用户的电子邮箱地址" } }, "required": ["name", "age", "email"] } }大白话翻译：告诉大模型“我这里有个抽屉叫save_user_profile，里面有三个格子，分别只能放字符串名字、数字年龄、字符串邮箱。你得帮我把格子填满。”第二步：向大模型发起对话请求现在，我们把用户的输入文本，连同刚才的函数说明（Tools）一起扔给大模型。# 伪代码示例 response = client.chat.completions.create( model="gpt-4o", # 或者其他支持工具调用的模型 messages=[ {"role": "user", "content": "老王今年40了，wang@163.com是他的邮箱。"} ], tools=[ { "type": "function", "function": { /* 这里放的就是第一步里的那段 JSON Schema */ } } ], # 强制让大模型必须调用我们提供的函数 tool_choice={"type": "function", "function": {"name": "save_user_profile"}} )

大模型提取结构化JSON——生产级

最新文章

StructBERT零样本分类-中文-base算力优化：显存占用仅1.8GB，支持多并发请求

Qwen3.5-2B开源模型教程：Conda环境隔离+torch28精准版本部署步骤

保姆级教程：用乐鑫官方工具给ESP8266烧写MQTT透传固件（含CH340驱动安装）

如何为Unity游戏实现实时翻译：XUnity AutoTranslator完整使用指南

CLIP ViT-H-14入门必看：特征向量L2归一化对相似度计算的影响分析

LoFTR Unleashed: Revolutionizing Feature Matching with Transformer-Based Detector-Free Approach

推荐文章

新概念英语第一册115_Knock knock

新概念英语第一册117_Tommy s breakfast

AI开发-python-langchain框架（--并行流程）慕

解锁多路视频分发：专业虚拟摄像头解决方案深度解析

多元高斯分布：条件分布的实际应用与推导解析

Volatility过时了？试试Lovelymem：图形化内存取证，5分钟提取进程哈希和SID

相关文章

掌握媒体捕获与视频下载的7个实用技巧：猫抓cat-catch浏览器扩展完全指南

Android开发者必备：轻量级二维码解决方案ZXingLite全面解析

MogFace人脸检测在AR应用：移动端人脸关键点实时追踪与特效叠加

解锁AI编程效率：6个Continue插件实战技巧让开发效率提升10倍

[游戏录像引擎] 突破视角限制：League Director重构《英雄联盟》视频创作流程

从RK3562实践出发：AMP架构下的RPMsg核间通信实战解析

分享文章

更多文章

YOLOv8 智能交通违章检测 - 闯红灯检测功能详解

VideoAgentTrek-ScreenFilter模型微调指南：使用自定义数据集训练专属过滤器

玻璃幕墙“室内侧”的耐撞击研究

个人八股之 -----jdbc的概述

SenseVoice-small惊艳效果：实时字幕生成延迟＜800ms实测数据分享

收藏必备！小白程序员快速入门大模型：三大关键技术突破解析

Qwen3.5-9B多模态教程：同一张图多角度提问（物体识别/情感判断/风格分析）

DoL-Lyra整合包：一键构建你的个性化游戏体验

可视化库选型

新加坡国立大学：AI图像生成实现手机端精准控制

AI智能文档扫描仪环境隔离：虚拟环境部署避坑指南

Claude Mythos模型：循环架构猜测背后的技术革新与潜力

大模型提取结构化JSON——生产级

最新文章

StructBERT零样本分类-中文-base算力优化：显存占用仅1.8GB，支持多并发请求

Qwen3.5-2B开源模型教程：Conda环境隔离+torch28精准版本部署步骤

保姆级教程：用乐鑫官方工具给ESP8266烧写MQTT透传固件（含CH340驱动安装）

如何为Unity游戏实现实时翻译：XUnity AutoTranslator完整使用指南

CLIP ViT-H-14入门必看：特征向量L2归一化对相似度计算的影响分析

LoFTR Unleashed: Revolutionizing Feature Matching with Transformer-Based Detector-Free Approach

推荐文章

新概念英语第一册115_Knock knock

新概念英语第一册117_Tommy s breakfast

AI开发-python-langchain框架（--并行流程 ）慕

解锁多路视频分发：专业虚拟摄像头解决方案深度解析

多元高斯分布：条件分布的实际应用与推导解析

Volatility过时了？试试Lovelymem：图形化内存取证，5分钟提取进程哈希和SID

相关文章

掌握媒体捕获与视频下载的7个实用技巧：猫抓cat-catch浏览器扩展完全指南

Android开发者必备：轻量级二维码解决方案ZXingLite全面解析

MogFace人脸检测在AR应用：移动端人脸关键点实时追踪与特效叠加

解锁AI编程效率：6个Continue插件实战技巧让开发效率提升10倍

[游戏录像引擎] 突破视角限制：League Director重构《英雄联盟》视频创作流程

从RK3562实践出发：AMP架构下的RPMsg核间通信实战解析

分享文章

更多文章

AI开发-python-langchain框架（--并行流程）慕