V3.2逼近Gemini 3 DeepSeek硬气喊话:接下来我要堆算力了
创始人
2025-12-02 11:40:59

格隆汇12月2日|据硅星人Pro,就在上周,OpenAI前首席科学家在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100 倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。

然而仅过了几天,12月1日,DeepSeek用V3.2和V3.2-Speciale的发布,给出了一个不同的答案。模型发布后,DeepSeek研究员在X上发文:“如果Gemini-3证明了持续扩展预训练的可能性,DeepSeek-V3.2-Speciale则证明了在大规模上下文环境中强化学习的可扩展性。我们花了一年时间将DeepSeek-V3推向极限,得出的经验是:训练后的瓶颈需通过优化方法和数据来解决,而非仅等待更好的基础模型。”而针对模型当前在世界知识广度上的短板,DeepSeek在技术报告中直言是因训练FLOPs不足,并硬气宣布后续将“扩大预训练算力”以弥补差距。

相关内容

热门资讯

家里最脏的一个地方,却被很多人... 转自:央视财经说起家里最脏的地方,你会想到哪里?马桶?垃圾桶?抽油烟机?这些地方确实脏,但都是明面上...
一字跌停,300344,或退市...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 年末券商看好的金股有...
《疯狂动物城2》救市,将冲击电... 来源:@经济观察报微博经观评论 韩浩月/文 据灯塔和猫眼等平台的数据,截至12月1日,《疯狂动物城2...
百利天恒收到 2.5 亿美元里... (来源:求实药社)12月1日,百利天恒发布公告,称其子公司 SystImmune 已收到由 BMS ...
受美国关税冲击 加拿大一主要钢... 新华社渥太华12月1日电(记者林威)据加拿大媒体12月1日报道,受美国征收高额关税带来的巨大财务压力...