9月25日消息,Meta官宣发布并开源其首款代码世界模型(Code World Model, CWM)。
图灵奖得主Yann LeCun亲自转发造势,将世界模型这一前沿架构正式落地代码生成任务。
这款参数量仅32B的模型,核心创新在于复刻了人类程序员的思考模式——生成代码前先在“脑海”中模拟执行效果。
不同于主流语言模型“逐词预测”的盲写逻辑,CWM通过融合Python与Bash环境的专属建模数据,能提前预判代码指令的执行结果,再反向规划出符合需求的代码,从根源上提升生成质量。
例如在“数出strawberry中字母r的数量”这类易出错的任务中,它会以类似调试器(pdb)的方式分步推演验证。
实测数据显示,这个“小参数模型”表现亮眼:
在真实开源项目缺陷修复评测SWE-bench Verified中拿下65.8%的成绩,与闭源的Gemini-2.5-Thinking持平,跻身开源阵营第一梯队。
在LiveCodeBench、Math-500、AIME 2024等基准测试中更分别取得68.6%、96.6%、76.0%的高分。目前Meta已同步开放3个不同用途的模型Checkpoint。
值得注意的是,CWM本质是一次概念验证。Meta仅投入有限算力,核心目标是验证“世界模型+代码生成”的技术路径可行性,这意味着当前版本更接近“Demo”,更大规模的迭代产品或在后续推出。(转自AI普瑞斯)