Claude Mythos模型：循环架构猜测背后的技术革新与潜力

张开发

• 2026/6/30 9:58:05 • 15 分钟阅读

分享文章

【导语Claude最强“神话”模型Mythos引发热议社区猜测其可能采用字节Seed团队提出的循环语言模型架构。测试数据显示Mythos在图搜索测试中表现优异引发对其架构创新的探讨。】Mythos图搜索测试超越对手近4倍关键线索源于Anthropic公布的测试数据。在广度搜索优先的图搜索测试GraphWalks BFS中Mythos超越对手GPT5.4最多得分达到80%而GPT5.4仅为21.4%接近4倍的差距。在其他类型任务上并未出现如此异常分差这表明这种进步很可能源于架构创新。循环语言模型小模型碾压大模型的秘诀字节Seed团队提出的LoopLM循环语言模型有三个特点一是在模型内部潜空间迭代不额外输出更多token二是能根据题目难易自动调节思考步数三是预训练时就学“怎么在潜空间思考”。实验中1.4B的Ouro模型性能对标约4B的传统模型2.8B的Ouro模型相当于8B - 12B的传统模型。论文分析了知识存储与知识操作的区别知识存储容量有限而知识操作能力随循环步数和训练tokens指数级增长。循环模型虽未增加知识库容量但提升了AI在知识库中的搜索和组合能力。三条线索指向循环模型架构第一条线索是广度优先图搜索测试结果Mythos分数远超GPT5.4且比上一代Opus提升幅度异常大。第二条线索是Anthropic报告Mythos每个任务使用的token数量是Opus4.6的1/5但速度更慢、价格贵5倍循环模型能解释这一矛盾因为推理发生在潜空间。第三条线索是Mythos在网络安全方面表现突出在CyberGym测试上领先Opus4.6近17个百分点且能找到上千个零日漏洞而漏洞发现本质是图遍历是循环架构的强项。架构创新与Scaling Law的较量Scaling Law能相对均匀地改善模型性能而架构创新在匹配其归纳偏置的任务上能创造异常尖峰值。循环Transformer的归纳偏置是迭代图算法Mythos的异常尖峰恰好出现在图遍历任务上。虽然Anthropic未公开Mythos架构信息但测试数据已暗示其可能采用循环模型架构。编辑观点Mythos若采用循环语言模型架构将为大模型发展带来新方向。其在图遍历等任务上的优异表现或推动架构创新成为提升模型性能的重要途径值得行业持续关注。

Claude Mythos模型：循环架构猜测背后的技术革新与潜力

最新文章

NVIDIA DGX SuperPOD：AI超级工厂的算力革命

STC8H8K64U单片机内存布局保姆级图解：从code区到EEPROM，新手避坑指南

TVA技术在能源行业的应用综述

python jwt

保姆级教程：在粤嵌GEC6818上搞定GY-39传感器数据采集（附完整源码）

Android音频启动流程避坑指南：AudioPolicyService与AudioFlinger的交互核心loadHwModule与openOutput详解

推荐文章

相关文章

分享文章

更多文章

Pixel Fashion Atelier保姆级教程：零基础玩家从选模版到锻造完成全流程

Alibaba DASD-4B Thinking 对话工具解决“403 Forbidden”等API调用错误排查指南

Qwen3.5-9B-AWQ-4bit助力STM32开发：嵌入式C代码逻辑验证与注释增强

微信小程序的同学会学生会活动经费系统

实测Qwen3-4B-Thinking-2507：自动生成Swagger文档和Mock Server代码全流程

工业时序数据库选型：从数据模型与存储引擎看 Apache IoTDB

简单几步：用Qwen2.5-7B镜像10分钟微调，实现AI身份转换

FreeRTOS消息队列

GME-Qwen2-VL-2B-Instruct实战案例：跨境电商平台多语言文案图文匹配优化

L3-040 人生就像一场旅行（Floyd）

Windows安卓子系统终极指南：从零到精通完整教程

云安全最佳实践