炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
出品|虎嗅黄青春频道
作者|商业消费主笔黄青春
头图|视觉中国
字节跳动 CEO 梁汝波首次公开站台,给了豆包。
6 月 11 日,字节跳动旗下火山引擎开了一场发布会,现场数位拿着号码牌的媒体硬是因为主会场人数爆满被拒之门外 20分钟,即便字节跳动公关竭力与现场安保交涉两轮,对讲机那头的负责人仍然不为所动,严格遵守出一进一的规则,导致主会场内很多火山员工为了给媒体腾位置都被迫中途出会场协同办公。
即便第三次交涉后虎嗅有幸进入内场,一番闪转腾挪仍被摩肩接踵的人群堵在了会场最后排的摄像臂旁,仿佛挤进了一节北京早高峰地铁车厢,上一次如此夸张的阵仗还是年初春运赶高铁(不由感慨,时代抛弃你的时候,连发布会都挤不进去)。
活动开始,无法进入主会场的人群
为什么一场产品发布会搞得这么火爆?
一方面,DeepSeek 凭一己之力掀翻了互联网,从微信到百度,从美团到小红书,国民级应用纷纷接入 DeepSeek,唯独豆包至今依然坚持自研,且字节系大模型雨后春笋般冒出来,还能始终保持超高的市场声量,自然会牵动着从业者乃至媒体、客户的神经。
比如,发布会上亮相的豆包1.6-thinking 在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上均跻身全球前列;再比如,新发布的豆包视频生成模型 Seedance 1.0 pro 在国际知名评测榜单Artificial Analysis上,文生视频、图生视频两项任务均蹿至榜首,一举超越 Veo3、可灵2.0 等优秀模型。
另一方面,火山引擎发布会上,字节跳动集团高管亮相是最多的,没有之一——从杨震原到朱骏,从张楠到洪定坤,这次梁汝波也被拉来站台,细细咂摸其发言也能窥见端倪。
梁汝波表示:字节跳动坚定长期投入,追求智能突破,服务产业应用——后者只能靠火山引擎落地,而做好火山引擎自然关乎整个字节跳动的生长路径。
尤其在 Al 时代,要做好一家创新的科技公司,除了坚定的投入外,还应该将技术开放出去,经过市场检验;与之对应,外部反馈也能进一步反哺技术进化,精进内部竞争力。
火山引擎总裁谭待解释,“火山引擎做到一定程度之后,会尽最大可能把技术红利释放出来,因为最重要的是通过技术红利释放让业界所有开发者和企业享受到实惠,这样他们的 AI 应用也会发展更快。”
以 2024 年豆包 1.0 发布为节点,当时火山引擎在模型结构和工程上做了大量优化和让步,率先将价格降低 99% 从而被行业戏称为“价格屠夫”,但随着其他厂商陆续跟进降价,中国大模型此后一年的发展速度确实在提速。
值得一提的是,火山引擎并未因此而陷入“补贴陷阱”:
有接近火山引擎人士指出,谭待在 2021 年一肩担起云计算业务时曾喊出 1000亿的营收目标,彼时很多人心里是打问号的,但这两年大模型带来业绩增速在所有产品中是最快的,而且毛利也是最好的之一,今年实现同比增速翻番压力并不大。
若火山引擎 2025 年真能实现超 230 亿营收,将会死死咬住占据先发优势的百度智能云(其 2024 年营收 218 亿元),甚至有望在 2026 年实现超越。
可以这么说,如果将一场发布会视作一家公司战略意志投射的细小切口,新品发布不过是业务发展主线上一个个节点;但这次火山引擎发布了豆包大模型 1.6,加速 Agent 大规模应用,则多了一层意义。
谭待认为,互联网经历三个时代的变化,从 PC 到移动再到 AI,最重要就是主体,对应的分别是 Web、APP、Agents。
“Agent 能够自主规划、反思、执行任务,围绕着 Agent 的开发范式正在发生根本变化——以前各种架构是为帮助程序员更好去设计,但核心是程序员为理解业务去规划;现在 Agents 很多集成步骤是通过模型策略展开,模型要跟工具、环境产生交互,这必然需要更好的模型和 Agent 平台。”谭待说道。
顺着这个逻辑去理解,基础架构亦是如此——数据以前 For BI,现在更多开始 For AI,多模态数据重要性提升,安全也进一步升级。以火山引擎刚发布的两个全新安全产品为例,卖点就是解决大模型防火墙、模型投毒被攻击、端加密(即通过端加密解决安全隐私)等问题。
不止于此,虎嗅了解到,包括方舟发布的新功能,Prompt Pilot 、Coding Agent、TRAE,还有知识库及多模态数据湖、安全等一系列方案均需要一个安全的 Agent 平台。
“这一系列衍生技术嵌套叫做 AI 云原生,也是火山引擎最早在业界提出来的。我们希望通过这样一套从开发范式到基础设施再到数据安全完整的 AI 原生方案服务企业,豆包1.6 就是基于此落地的高性价比大模型。”谭待说完顿了顿,旋即又对性价比做了进一步“祛魅”,主要分三个方面:
一是,此前外界认为是否开启深度思考,是否做图文、图像理解会直接影响大模型成本,实际上同尺寸、同参数模型,是否开启深度思考,是否做图文、图像理解不会影响模型成本,只会影响上下文窗口——基于此,以前模型深度思考贵一些、图文理解贵一些是不合理的,火山引擎将价格进行了统一。
二是,上下文窗口是一个累加成本的递增,但大部分输入有一个分布区间,如果在调度上能把不同长度的输入输出先 PD 分离再集中调度就可以大幅优化成本(注:并行计算如果长度不统一会互相思索,如果将这些架构长短分离,实际上每个区间成本都可以做定向优化)。
三是,AI 大模型最多的应用场景是聊天,但随着 Agent 开始完成工作流任务,Token 消耗迅速爬升,如何降低 Token 消耗便尤为重要,火山引擎集中将企业用得最多的区间成本降低了 63%。
具体到实际使用场景,企业绝大部分请求输入都在 32K 以内,输入输出占比在3:1。那同样的请求,基于豆包1.5 thinking 和 DeepSeek R1 综合成本是 (4* 3 + 16 * 1)/ 4 = 7元,而基于豆包 1.6只需要(0.8 * 3 + 8 * 1)/ 4 = 2.6元,企业成本下降 63%,即花费原本三分之一左右的价格就能获得一个能力更强、原生多模态的新模型。
这很大程度上得益于工程优化,包括通过 ServingKit 方案把推理成本优化,以及方舟能够做到更好地按照区间来集成调度,这样才能把区间的价格打下来,这是至关重要的一个点。
比订酒店为例,传统 APP 需要用户自己去选,但一些事情无法非常便捷获取,比如房间镜子大小、桌子摆放、带小孩能否加床,网站预订、电话咨询起来非常繁琐,但做成 Agent 之后可以全网搜用户反馈,甚至 AI 与前台进行个性化需求沟通。
对此,火山引擎智能算法负责人吴迪认为,AI就像未来的水和电一样,提供水、电的公司并不会因为单位利润高带动变革,而是要整个行业通水、通电赚取服务利润才能长久。
甚至,以后 Agent 和 Agent 之间会互相沟通,互相联网。
对此,字节跳动技术副总裁洪定坤认为,随着模型能力的持续进步,AI 有机会通过调用不同 Agent 和工具让软件开发“all in one”。
“豆包 1.6 模型在编程能力上进步很大,已经接入字节跳动的 AI 编程产品 TRAE 内测,超过 80% 工程师在使用 TRAE 辅助开发,TRAE 整体月活已经超过 100 万。”洪定坤说道。
至此,从字节跳动 CEO 梁汝波站台到字节跳动研发“一号位”洪定坤镇场子,整个大会由场景进阶辐射至Agent 野望,更像一次集团意志定调的发展分水岭。
接近字节跳动人士表示,火山引擎是明牌,但暗线上是字节跳动抢 Al 云话语权的决心。
或许会有读者好奇:阿里云、华为云、腾讯云、百度云凭借自身资源已然占据先发优势与人才优势,火山引擎晚了近十年才“上桌”,凭什么后来居上,甚至决心争第一的底气是什么?
要回答这个问题,单纯进行产品、业务规模的对比似乎缺乏说服力,但直击字节跳动做云的底层逻辑,从业务发展节奏,集团意志这些层面或许能得到一些解答:
首先,要有业务支撑起足够大的规模(包括用户规模与算力、带宽等资源规模),(理论上)云才会获得最优成本。
抖音一度被称作“时间熔炉”,超 10 亿人日均超两小时要被其“吞噬”,与之对应需要一个庞大的算力系统支撑,云计算属于重资产运营模式,本质上服务器资源租赁比拼性价比,是一门典型的规模生意,底层逻辑是要通过尽可能多的海量调用去摊薄成本,抖音系产品活跃存在波峰波谷,闲时如果可以通过向 B 端客户租赁服务器资源无疑会极大提升算力调优能力。
当然,火山引擎比其他厂商晚了近十年,规模无法凭空建立起来,但技术可以靠招揽人才解决——与之对应,近两年,字节跳动对技术人才越发“饥渴”,比如针对大模型的 Top Seed 计划,不限制人数,就是拿出一大笔钱去招揽全球最优秀的大模型人才。
不得不感慨,字节确实通过人才提速极大缩小了与具备先发优势厂商的差距——以最新数据为例,豆包大模型日均 Token 使用量超过 16.4 万亿,较去年 5 月首次发布时增长 137倍;另据 IDC 报告,豆包大模型在中国公有云大模型市场份额排名第一,占比高达 46.4%,比二三名加起来调用量都多。
其次,自 2023 年大模型浪潮席卷至今,大语言模型在训练和推理过程中需要大量的计算资源(即算力),大部分资金最终会流向云服务商,但字节跳动却至今没有一笔大模型投资——按说腾讯、阿里都在积极押注 AI 六小龙乃至更多的大模型团队,为何字节跳动迟迟不出手?
一位 AI 行业资深人士向虎嗅分析,阿里、腾讯“撒网式”投资策略,一方面源于资金储备雄厚且不愿错失细分机会;另一方面,也说明很多大厂没有那么笃信大模型时代会呼啸而至,当下其所具备的颠覆价值还不足以下定决心 All in,所以躬身跳入大模型突围战时有所保留。
难道字节跳动就不怕错失投中细分赛道独角兽的机会吗?
虎嗅与数位接近字节跳动人士沟通发现,字节跳动在大模型浪潮兴起之初,就从核心高管到业务一号位达成共识:坚持自研。
虎嗅认为,这可以从两方面来理解:
一是,DeepSeek 犹如热浪席卷而过,市场叙事不再局限于眼花缭乱的“新模型”以及枯燥的参数比拼,行业开始从技术路线、落地场景层面思考大模型竞争格局。
字节内部认为,客户需求不会被一家模型公司全部满足,评价一个模型有几十个不同维度,OpenAI、Claude、Google 也是某些方面强,某些方面弱一些,豆包的技术路线和DeepSeek存在差异,但从 B 端需求来看,很多企业应用方向主要是数据分析、离线抽取、聊天对话、市场信息处理,这些维度豆包强于DeepSeekRI模型,坚持自研会让路“越走越宽”。
二是,大模型浪潮的推动之下,AI 正在为企业打开新的增长空间,而中国移动互联网已到了用户、流量趋于见顶的成熟期,监管会更侧重产业互联网的推进与建设,这意味着技术走到平台重构生态的关键时期。
若 AI 必将成为贯穿数万家企业、万亿产值就业岗位的链接管道,字节能否构建起包括服务器、操作系统、芯片、SaaS 等在内的完整自研体系,很大程度上影响着其生态重构的进度,以及能否掌控更多互联网入口。
有鉴于此,字节选择毕功于一役,自然会坚持自研,不再去投资押注,以避免算力、资源和人才的分散——这不仅需要产品或服务领先其他人,还需要管理层的决心,云是非常烧钱的业务、赚的是辛苦钱,愿不愿意坚持推行差异化的策略既考验定力也考验投入的耐心。
当然,只有决心、耐心还不够,AWS、阿里云都是咬牙熬了多年才盈利,所以还需要一点运气——毕竟若长期看不到一点机会,再坚定的意志可能也会动摇。
这背后深层次考量还在于,字节跳动近年来有意强化外界定位:自己是一家科技公司,而不希望被外界视作娱乐平台——做好大模型、打赢 AI 攻坚战、抢占更多广义互联网入口,是关乎公司“基因重组”的关键。
此前,昆仑万维(维权)周亚辉有过一个私下分享,大意是国内很多人将字节跳动视作一家娱乐集团,但其实字节跳动志在对标亚马逊——一边卖广告,一边卖云,公司在产品、技术双轮驱动下野蛮“发育”。
如此来看,火山引擎还肩负着字节跳动向一家科技公司蜕变的使命。
#虎嗅商业消费主笔黄青春、黄青春频道出品人,关注文娱社交、游戏影音等多个领域,行业人士交流加微信:724051399,新闻线索亦可邮件至huangqingchun@huxiu.com
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4452650.html?f=wyxwapp