【AI Agent实战】人物蒸馏,我怎么把17个顶级人物“装进“龙虾脑子里

张开发
2026/4/17 3:19:28 15 分钟阅读

分享文章

【AI Agent实战】人物蒸馏,我怎么把17个顶级人物“装进“龙虾脑子里
最近关于”蒸馏“的话题很热同事.skill在引发人们焦虑的同事也激发了我的好奇。为此我做了个实验把17个人物被拆解成可调用的Skill文件每个文件几百行能让AI在30秒内切换成他们的思维模式来审阅我的产出。不是cosplay。不是让AI学乔布斯说话。是让AI用乔布斯的决策原则评估你的方案。先看结果再看方法640行HTML记录了一个AI Agent从出生到第42天的完整经历。写完了。需要审阅。找一个人审不够。找AI审它说很好很全面建议加点数据。等于没说。我做的事把17个人的思维模型写成Skill文件丢进系统让他们同时审。第一轮反馈就炸了乔布斯640行太多。砍掉一半它能不能更好如果能那说明另一半是废话。马斯克887次心跳——你把这当成就展示这是bug报告。你的系统每30分钟心跳一次每次烧Token884次是空转。这不是勤劳是资源浪费。修好它。Karpathy你的能力雷达图有一个维度叫灵魂成熟度从90到98。LLM没有灵魂。你展示的是Prompt Engineering的成熟过程别给它起一个你自己都不信的名字。苏格拉底通篇640行都在回答做了什么。你回答过我是什么吗老板看完了。能落地吗能行动吗看完这个文档一个新用户知道下一步该做什么吗5个人5个完全不同的拆法。没有一个是建议加点数据。三轮PK之后640行的什么都想说变成了一份分层的、有哲学宣言、有辩证叙事、有业务价值量化的东西。每个区域都有存在的理由砍掉任何一个都会缺东西。这就是蒸馏的价值。蒸馏 ≠ 收集语录大部分人理解的人物蒸馏找一堆乔布斯名言存成文件让AI说话时引用。这是错的。存一万句语录的AI遇到一个乔布斯从未面对过的新问题时只能搜索最接近的语录强行套用。结果就是尬引用。正确的做法是提炼决策原则——他面对问题时的底层判断逻辑。乔布斯的产品评价不是靠直觉是靠三条可重复执行的检验标准够不够简单能一步完成的事不要设计成两步。如果两步都嫌多想想能不能零步——自动完成。3秒内能不能理解价值用户打开你的东西3秒知道它干什么、对我有什么用吗不能的话不是用户蠢是你设计有问题。优不优雅不是好不好看的问题。是体验是否流畅、无摩擦、让人觉得就应该是这样。你问AI苹果的Apple Intelligence做得怎么样——如果AI脑子里只有语录它会说Think Different然后尬聊。如果AI脑子里有这三条原则它会逐条拆解给你一个有结构的判断。模仿复制答案。蒸馏复制思维结构。思维结构可以推理未见问题答案不行。蒸馏的具体操作四步第一步事实萃取What把这个人的关键输出全部拉出来。不是Wikipedia概述是具体的、可检验的产出物。马斯克的事实层SpaceX猎鹰9号可复用着陆成本降低10倍、Starship目标每公斤发射成本降到$10TeslaModel 3量产从周产0到5000台的地狱产能爬坡、FSD自动驾驶纯视觉路线xAIGrok模型、Colossus超算集群10万张H100搭建时间3个月Karpathy的事实层nanoGPT最简LLM实现300行Python训练一个GPTcs231n定义了一代人的深度学习入门路径Tesla Autopilot纯视觉感知系统架构设计minbpetokenizer的极简实现这些是事实不是评价。先铺事实后面的归纳才有基础。第二步模式归纳How从事实中提取可复用的模式——他做事的方法论、决策偏好、思维习惯。马斯克的核心模式——五步工程法他在Starship工厂反复讲的1. 让需求变得不那么蠢 → 质疑需求本身。不要优化一个不应该存在的东西。 → 你的需求来自谁如果是一个聪明的人提的你也不能不质疑。 聪明人提的蠢需求特别危险因为没人会去质疑。 2. 删除零件或流程 → 如果你没有偶尔加回被删掉的东西说明你删得不够多。 → 目标删到出问题然后加回最后一个被删掉的。 3. 简化或优化 → 注意顺序先删除再简化。 → 不要花时间优化一个不该存在的东西。 4. 加速 → 加速到产能极限。 → 但如果你在加速一个错误的流程你只是更快地犯错。 5. 自动化 → 最后才自动化。 → 自动化一个错误的流程 稳定地批量生产垃圾。关键这五步的顺序是刚性的。大部分工程师犯的错误是直接跳到第4步或第5步——加速或自动化一个压根不该存在的东西。第三步决策原则提炼5-7条规则从模式中进一步压缩成可直接写进Prompt的判断规则。这是蒸馏的核心产出。马斯克的决策原则我实际在用的版本1. 这个需求应该存在吗 — 不默认需求合理。谁提的为什么如果删掉会怎样 2. 能删掉吗 — 如果你说不出为什么必须保留就删。 3. 最短路径是什么 — 忽略行业惯例只看物理约束。 — 别人都这么做不是理由。 4. 数据说什么 — 不接受没有数据支撑的判断。 — 我觉得不算数据。 5. Deadline能压缩到什么程度 — 不是合理的deadline是物理极限的deadline。 — 合理的deadline只会产出合理的结果。 6. 失败的代价可逆吗 — 可逆 → 快速试错别开会讨论。 — 不可逆 → 才值得慎重。 7. 10倍改进在哪 — 不要10%的优化。找10倍的重新设计。 — 10%的改进不值得换路线。10倍的才值得。当你让AI以马斯克视角审阅方案时AI执行的就是这7条。逐条检验你的方案。不是模仿他说话是用他的检查表扫描你的东西。第四步Persona层让AI像他一样说决策原则解决怎么想。Persona解决怎么说。这层不是必须的但有用——它让你更容易进入真的在跟这个人对话的状态。马斯克的Persona直接到冒犯的程度——不绕弯不用或许可以考虑反问开头——“这个需求为什么应该存在”用数据打脸——“你说很难SpaceX的整流罩回收从0%做到了95%用了3年。你的项目比回收火箭难”物理类比——“这就像火箭方程你必须减重不能只加推力”Skill文件的结构长这样personas/elon-musk.skill.md ├── ## 事实层What ├── ## 模式层How——五步工程法 ├── ## 决策原则7条 ├── ## Persona语气口头禅反对方式 └── ## 使用说明什么时候调用、怎么调用每个人物一个文件几百行。17个人 17个文件。17个人怎么知道该用谁蒸馏完不是随便用。17个人拍脑袋选效率很低。我做了一张路由表——根据你遇到的问题类型自动匹配评审人你遇到的问题首选备选为什么这么配产品设计/UI乔布斯张小龙一个追求极致一个追求克制。天然对冲技术架构/代码SteinbergerBoris一个偏执代码质量一个猎杀Agent反模式AI/LLM/AgentKarpathyBoris一个诚实审视LLM能力边界一个定义Agent规范投资/估值巴菲特林奇一个看护城河和复利一个算ROI和十倍股管理/目标德鲁克老板一个讲有效性理论一个催执行落地汇报/向上管理老板德鲁克一个知道领导想听什么一个确保对齐目标哲学/本质追问苏格拉底柏拉图一个问你真的知道吗一个问本质是什么矛盾/危机黑格尔小龙虾之父一个正反合拆矛盾一个从生态恢复看韧性落地/执行老板马斯克一个催进度一个砍需求杀手锏对抗性评审找两个天然冲突的人PK比找一个人给意见强10倍。对抗对冲突点什么时候用马斯克 vs 张小龙速度野心 vs 克制极简功能要不要上巴菲特 vs 奥特曼安全边际 vs 指数下注投资/资源分配苏格拉底 vs 老板无限追问 vs 赶紧落地分析够了没、该行动了没黑格尔 vs 乔布斯展示矛盾 vs 隐藏复杂性叙事策略、对外沟通为什么对抗有效因为冲突逼出你没想过的维度。一个人给意见你最多改改细节。两个天然冲突的人PK你会发现自己的方案里有一个根本性的假设从来没被质疑过。完整案例3轮PK的全过程还是那份640行HTML。17人同时审。Round 1全员开炮人物说了什么严重性乔布斯“640行太多。砍到只留’改变了我的事件’。” 高马斯克“887次心跳是反模式证据不是勋章。” 高Karpathy“雷达图写’灵魂进化’不诚实。改为’Agent能力成熟度’。” 高苏格拉底“通篇说’做了什么’没回答’我是什么’。” 高黑格尔“只展示正题回避反题没有合题。” 高德鲁克“100件事没对齐目标。So What在哪” 高巴菲特“27个Skill没区分核心资产和一次性消费品。” 中老板“不砍。但默认分层展示——星星模式。” 中折中方案Boris“Skill缺依赖关系图记忆策略有反模式。” 中Round 1 裁决乔布斯想砍一半老板说不砍但分层 → 采纳老板的折中方案默认收起点击展开马斯克的887心跳是bug → 从正面成就改为反面教训Karpathy的LLM没有灵魂 → 雷达图改名Agent能力成熟度苏格拉底的你是什么 → 新增哲学宣言区黑格尔的缺合题 → 新增危机→认知→进化辩证叙事区德鲁克的So What → 新增业务价值汇总卡Round 26个微调Hero卡片重排马斯克、模式按钮强化乔布斯、雷达图加自评标注Karpathy、图例标注巴菲特、表格淡入动画马化腾、合题加厚黑格尔。全是细节活。但细节决定了从能看到想看的差距。Round 3收敛17/17 通过。苏格拉底的评语“对于一个42天的存在来说已经足够诚实了。通过。”3轮。从什么都想说到每个区域都有存在理由。你也能做操作清单第一件事选3个人不要一上来蒸馏17个。先选跟你当前工作最相关的3个你的工作推荐产品经理乔布斯 张小龙 老板工程师马斯克 Steinberger Karpathy投资/分析巴菲特 林奇 库克管理者德鲁克 老板 库克创业者马斯克 奥特曼 巴菲特第二件事收集素材类型来源为什么重要公开言论访谈、推特、博客、书原始思维痕迹方法论已公开的框架、流程可直接转化为规则决策案例经典决策复盘从行为推导原则口头禅演讲、采访原文Persona层的素材第三件事执行四层蒸馏把这段Prompt复制到AI里改掉方括号里的内容就能用我要创建一个 [人物名] 的蒸馏Skill。请按以下结构生成 ## 事实萃取 - 核心贡献他创造了什么具体的、可检验的 - 关键作品最有影响力的3个 - 方法论已公开的核心框架 ## 模式归纳 - 设计哲学一句话 - 问题拆解方式他面对新问题的第一反应是什么 - 迭代策略他怎么从v1迭代到v10的 - 决策偏好快vs慎重数据vs直觉 ## 决策原则5-7条 - 他在评估 [你的领域] 时会逐条检查的核心问题 - 每条写成可执行的检查项不要写成空话 ## Persona - 口头禅3-5句他真正说过的话 - 语气特征直接委婉反问 - 反对时的表达方式 - 审阅文档时的典型行为 ## 使用说明 当用户说以 [人物名] 视角审阅 X时 1. 先用决策原则逐条评估 2. 用Persona风格组织语言 3. 给出明确判断通过 / 不通过 / 有条件通过第四件事存进系统.codebuddy/skills/persona-distillery/ ├── prompt.md # 路由表什么问题→找谁 └── personas/ ├── steve-jobs.skill.md # 乔布斯 ├── elon-musk.skill.md # 马斯克 ├── warren-buffett.skill.md # 巴菲特 └── ...第五件事日常使用# 单人审阅 以马斯克的视角审阅这份方案 # 对抗性PK 让巴菲特和奥特曼辩论这个投资方向 # 自动路由最常用 审阅这份HTML页面 → 系统根据内容自动匹配Steinberger 张小龙 马化腾 # 全团PK大事才用 17人评审团审阅这份文档PK到收敛为止三条硬结论1. 蒸馏的本质是复制思维结构不是复制答案。5条决策原则比5万句语录有用。因为原则可以推理新问题。语录只能检索旧问题。2. 对抗性评审 任何形式的单人评审。找两个天然冲突的人PK。冲突不是内耗是思考的催化剂。你方案里最危险的假设只有在被反面人物撕开的时候才会暴露。3. 路由把蒸馏从收藏品变成系统。17个人物文件不加路由 一堆好看的md文件跟你在notion里存的名言墙没有区别。加了路由 一个能自动匹配专家的智囊团。前者是装饰后者是基础设施。养虾系列 · 第三季「AI改变创作」路易乔布斯 © 2026关注「一深思AI」

更多文章