Claude Mythos模型:循环架构猜测背后的技术革新与潜力

张开发
2026/4/14 8:04:48 15 分钟阅读

分享文章

Claude Mythos模型:循环架构猜测背后的技术革新与潜力
【导语Claude最强“神话”模型Mythos引发热议社区猜测其可能采用字节Seed团队提出的循环语言模型架构。测试数据显示Mythos在图搜索测试中表现优异引发对其架构创新的探讨。】Mythos图搜索测试超越对手近4倍关键线索源于Anthropic公布的测试数据。在广度搜索优先的图搜索测试GraphWalks BFS中Mythos超越对手GPT5.4最多得分达到80%而GPT5.4仅为21.4%接近4倍的差距。在其他类型任务上并未出现如此异常分差这表明这种进步很可能源于架构创新。循环语言模型小模型碾压大模型的秘诀字节Seed团队提出的LoopLM循环语言模型有三个特点一是在模型内部潜空间迭代不额外输出更多token二是能根据题目难易自动调节思考步数三是预训练时就学“怎么在潜空间思考”。实验中1.4B的Ouro模型性能对标约4B的传统模型2.8B的Ouro模型相当于8B - 12B的传统模型。论文分析了知识存储与知识操作的区别知识存储容量有限而知识操作能力随循环步数和训练tokens指数级增长。循环模型虽未增加知识库容量但提升了AI在知识库中的搜索和组合能力。三条线索指向循环模型架构第一条线索是广度优先图搜索测试结果Mythos分数远超GPT5.4且比上一代Opus提升幅度异常大。第二条线索是Anthropic报告Mythos每个任务使用的token数量是Opus4.6的1/5但速度更慢、价格贵5倍循环模型能解释这一矛盾因为推理发生在潜空间。第三条线索是Mythos在网络安全方面表现突出在CyberGym测试上领先Opus4.6近17个百分点且能找到上千个零日漏洞而漏洞发现本质是图遍历是循环架构的强项。架构创新与Scaling Law的较量Scaling Law能相对均匀地改善模型性能而架构创新在匹配其归纳偏置的任务上能创造异常尖峰值。循环Transformer的归纳偏置是迭代图算法Mythos的异常尖峰恰好出现在图遍历任务上。虽然Anthropic未公开Mythos架构信息但测试数据已暗示其可能采用循环模型架构。编辑观点Mythos若采用循环语言模型架构将为大模型发展带来新方向。其在图遍历等任务上的优异表现或推动架构创新成为提升模型性能的重要途径值得行业持续关注。

更多文章