01
贝叶斯定理:最伟大的定理之一
要我推荐一个定理,我觉得贝叶斯一定是最伟大的定理之一。
因为它讲的其实是一个非常深刻、但又非常日常的道理:
人不是先知道答案,再行动;而是先有一个判断,再根据新信息不断修正。
它的公式非常简洁:
P(A∣B)=P(B∣A)P(A)P(B)
各部分也不复杂:
P(A)是先验概率,也就是还没看到新信息之前,你原本怎么判断。
P(B∣A)是似然,也就是如果 A 真的成立,那么证据 B 出现的可能性有多大。
P(B)是证据本身出现的概率,也就是这个信号到底稀不稀缺,值不值得大惊小怪。
P(A∣B)是后验概率,也就是看到新证据之后,你更新后的判断。
02
用贝叶斯定理看豆包
把贝叶斯定理放到豆包这件事里
把它放到豆包这件事里,就很好理解了。
广告系统最重要的,不是单纯多投广告,而是更准确地判断:用户现在到底想要什么。
以前平台主要靠行为数据来猜你想要什么。
比如你看了什么视频、停留了多久、点了什么赞、搜过什么关键词。
这些东西当然有用,但问题是,它们很多时候都只是“像”,不一定真的是。
你看汽车视频,可能是想买车;也可能只是喜欢看测评,或者刚好刷到了。
你刷日本旅游内容,可能是准备去东京;也可能只是觉得樱花好看,甚至是在帮朋友做攻略。
也就是说,行为数据像是隔着毛玻璃看你。
能看出一点倾向,但隔着一层,始终是在猜。
而对话数据就不一样了。
对话不是“你看了什么”,而是“你自己开口说了什么”。
比如一个用户直接说:
>“我五一想去东京,预算 6000,两大一小,最好住地铁站附近。”
这句话的价值非常高。
因为它不是在释放模糊兴趣,而是在主动交代自己的需求。
时间有了,预算有了,目的地有了,同行人有了,偏好也有了。
这已经不是“这个人可能对旅游感兴趣”,而是“这个人很可能已经进入决策阶段了”。
用贝叶斯的话说,这就是来了一个很强的新证据 B。
于是平台对“这个用户确实有旅游需求”这个判断的后验概率:
就会一下子升高很多。
你可以把它想象成一个店员。
以前这个店员只能偷偷观察你:你在鞋柜前站了多久,拿起过哪双鞋,回头看了几次。
他可以猜,你可能想买跑鞋。
但这终究只是猜。
现在不一样了。
你直接走过去跟他说:
>“我下个月要跑半马,预算 800,膝盖不太好,想买双缓震好一点的。”
这时候店员几乎就不用猜了。
因为你已经把自己的真实需求说出来了。
03
豆包免费背后的商业逻辑
所以再说得更直接一点:
短视频行为数据像是在猜,对话数据像是用户自己在报答案。
前者是通过你的动作去推测你的意图;后者是你直接把意图说出来。
两者都能用,但信息质量完全不是一个级别。
而广告系统最值钱的能力,其实从来都不是“把广告塞给更多人”,而是更早一点、更准一点地知道,谁现在真正需要什么。
一旦这个能力提升,影响的就不只是广告点击率。
它会往下传导到很多地方:
推荐会更准
搜索会更贴需求
电商转化会更高
商业投放会更有效率
所以豆包免费这件事,不能只理解成“烧钱换用户”。
从贝叶斯的角度看,它更像是在做一件很划算的事:
用一个低门槛、免费的 AI 入口,换取最有价值的东西:用户意图的强信号。
因为对字节来说,会员费当然重要,但更重要的,可能是整个平台理解用户的能力再提升一点点。
别小看这一点点。
如果一个系统原来只能靠看你“像不像”,现在突然能听见你亲口说“我到底要什么”,那它对你未来行为的判断,就会发生质变。
所以豆包免费,未必是在亏钱。
更准确地说,它是在用免费服务,换高质量证据;再用这些证据,不断更新对用户意图的判断。