应对外卖市场激烈竞争的同时,美团在大模型赛道悄然推进。10月27日,美团LongCat团队发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平),可稳定输出5分钟级别的长视频。2023年,美团元老王慧文自带5000万美元成立光年之外,后续由于个人健康原因,公司由美团创始人王兴“兜底”。接手光年之外的同时,美团继续研发大模型,在2024财年业绩发布会上,美团还正式明确了AI策略。两年光阴,外界更多看到的是外卖市场的硝烟,其实横空出世的美团LongCat团队及模型,不算后来者。
连发三款
当普罗大众提到美团时会想到什么?大概率是外卖。就是这家以外卖闻名的公司,9月至今已公开三项大模型进展。9月1日,美团发布并开源大语言模型LongCat-Flash-Chat(中文名:龙猫),LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts,MoE)架构,总参数560B,激活参数18.6B—31.3B(平均27B),实现了计算效率与性能的双重优化。
9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。综合评估显示,LongCat-Flash-Thinking在逻辑、数学、代码、智能体等多个领域的推理任务中,达到了全球开源模型的最先进水平(SOTA)。
一个月后的10月27日,同样的话术,美团再说了一遍,美团LongCat团队再次发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最先进水平),并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性,在长视频生成领域具备显著优势。
一个外界更容易感知的数据被提及,LongCat-Video视频生成模型可稳定输出5分钟级别的长视频,且无质量损失。
意外不意外
北京商报记者在与视频生成模型从业者沟通时了解到,同行对美团在视频生成模型领域的成绩表示,“不意外。视频模型大部分闭源,开源的少,达到开源SOTA不怎么有代表性”。该人士还告诉北京商报记者,“美团做这类模型我不意外,美团自己有内容需求,而且视频生成模型有可能为具身提供模拟数据”。
另一位大语言模型企业从业者向北京商报记者分享了一个比较模型能力的窍门,“可以看看同行反馈,如果同行在发布新模型的时候,愿意对比这个模型,那可能说明还不错。美团这个模型还得等等实际反馈,看看有没有达到官宣的效果”。
根据美团援引的技术对比图,与Veo 3、Seedance 1.0 Pro等在文生、图生视频任务上的比较,LongCat-Video在136亿参数的视频生成基座模型,在文生视频、图生视频两大核心任务中,综合性能均达到当前开源领域SOTA级别;通过文本-视频对齐、视觉质量、运动质量、整体质量四大维度评估,其性能在文本对齐度、运动连贯性等关键指标上展现显著优势;在VBench等公开基准测试中,LongCat-Video在参评模型中整体表现优异。
文渊智库创始人王超则有不同看法,“美团跟大模型之间没有太必然的联系,尤其是视频大模型这款,即使客户有视频生成需求,但是需求可能没那么大”。
为了“零售+科技”
站在自身业务之外看,美团在大模型赛道逐渐高调的态度似乎有了答案。加之美团发布此款模型时就强调了“世界模型”。
美团LongCat团队认为,此次发布的视频生成模型,是为探索“世界模型”迈出的第一步。未来,凭借精准重构真实世界运行状态的能力,LongCat模型也会融入公司近年来持续投入的自动驾驶、具身智能等深度交互业务场景中,成为公司更好连接“比特世界”和“原子世界”的技术基础。
2024年,美团集团战略从“Food+Platform”升级为“零售+科技”,明确将AI、机器人、自动驾驶等作为未来核心方向。宇树科技、星海图、银河通用、它石智航等具身智能企业背后都有美团的影子。
“在具身智能赛道,美团冲劲十足。”王超说。
2024财年业绩发布会上,王兴首次阐述了公司的AI战略布局,主要通过三层架构推动技术落地:AI at Work,目标是利用AI工具提升超过10万名员工的工作效率;AI in Products,旨在用AI改造现有产品并创建原生AI应用;BuildingLLM,持续投入资源自研大模型。
当时王兴就提到了LongCat大模型,称该模型结合外部模型为员工推出了多种AI工具,包括AI编程、智能会议、文档助手等,并透露LongCat API的调用量占比从上一年年初的10%增长到68%。
如今,不止一个美团大模型的落地应用已上线,前有AI图像生成应用“妙刷”,以及用于餐饮推荐、问答交互等场景的问小袋、米鲁等AI智能助手,后有AI编程应用NoCode,支持前端开发、数据分析、运营工具和门户网站生成等。
北京商报记者 魏蔚