明年大模型公司或许会更少,中国做AI最大的优势是人才。
AI六小龙之一的MiniMax创始人闫俊杰在创业初期遇到过很多挑战,其中包括硅谷银行破产,“所有的钱都在那个银行里,那个时候已经没法发工资了。”
但或许更大的挑战来自DeepSeek,连他的姥姥都在问“你知道 DeepSeek吗?”
他在近日做客罗永浩的播客节目中提到,团队反思过“为什么没有做得那么好”。很多问题是自己作为掌舵者的认知不够,行业里有很多像梁文锋这样厉害的人,他也提到和梁文锋在DeepSeek 成立前就认识,每年会交流几次。
“连姥姥都问我,你知道DeepSeek吗?”
DeepSeek的出现给MiniMax在内的大模型公司带来了很多变化。
闫俊杰提到,今年春节回老家时,发现所有人都在关注DeepSeek,“就连我姥姥都问我,你知道DeepSeek吗?”
他表示对这个事并不嫉妒,但很大的触动在于,“为什么没有做得那么好?”最终发现,有些明明知道应该要做出来的东西,但团队降低了要求,没有思考得更深,在那个时间点、在一些选择上也没那么坚定。而DeepSeek在那个时间点有自己独特的认知,也有很长时间的技术积累。
闫俊杰发现,公司经历的大部分挑战,最终都还是变成了怎样提升自身的能力。而团队做得比较好的事,是在受到很多打击时反而能变得更好。
在访谈中,提到士气低迷时用什么方式恢复信心?闫俊杰认为重点是鼓舞士气和发钱。
“拆解问题,用第一性原理让大家接受这件事是可行的,就能鼓舞士气,这是一部分,第二部分是给大家发更多的钱,让大家的努力被看见被反馈。”闫俊杰发现,发钱是管用的。
就在今年9月,MiniMax启动百万美元期权激励人才。根据员工对公司的贡献程度不同,MiniMax将向员工提供几十万美元到几百万美元不等的激励。不仅是模型算法,产品、市场、增长、职能等岗位都在期权激励范围内,后续还会继续对突出贡献者进行即时期权激励。
DeepSeek的出现或许一定程度让MiniMax对技术路线更加坚定。
ToC和出海是MiniMax独特的打法,其角色陪伴类应用Talkie在海外获得了大量用户。在这次交流中,闫俊杰透露,目前公司用户量最大的产品是Talkie,而收入方面最大的是视频和API。
对于是否坚持技术驱动,模型还是产品优先,闫俊杰表示,MiniMax经历过大约半年时间的迷茫和纠结。摇摆的点在于,他们认为,MiniMax不应该靠纯烧钱来增长,即便是为了AGI,也必须得用可商业化的方式来实现。因为AGI需要足够长的时间,成本也会比传统互联网公司要高得多。
但团队发现,通过模型能力来让产品或者业务变好,和通过复制移动互联网的经典路线来让它变好,这两个东西有可能都是对的,但这两个东西没办法共存。因此,团队只能选择其一。
他认为,虽然复制移动互联网的路线可能变现更容易,比起纯技术驱动更务实。但他后来意识到,这不是适合MiniMax的路线,“特别是在这个赛道上,我们能做的就只能是技术驱动的这种方式。”目前这个阶段技术驱动是明显占优的,但同时风险也会更高。
作为一家创业公司,MiniMax在大语言模型、语音、视频等方面都有布局。“外界很奇怪,一个创业公司什么都做,是不是不聚焦?”闫俊杰回应外界质疑时认为,真正的AGI一定是多模态输入和输出,团队的想法是将每个模态先走通,再找合适的时机整合。
“目前我们基本上具备了基础,每个模态都已经有了数据、使用场景,我希望在接下来几个月将它们整合到下一代模型里。”闫俊杰认为,OpenAI的Sora2就是典型的多模态融合,获得了巨大的成功。
明年大模型公司会更少
目前,国内的大模型与海外顶尖模型的差距在缩小,但却用了更少的钱。如谷歌、OpenAI、Anthropic和xAI这些公司估值可能是中国公司的100倍,但是技术或许就领先5%,投入可能在50至100倍之间。
究其原因,闫俊杰认为,中国的AI人才是非常重要的优势。推动DeepSeek取得成功的人才都是来自本土,他提到,MiniMax同样,虽然内部也有海归,但真正在公司起到关键作用的人才,基本上都是来自本土,且是他们的第一份工作。
他甚至认为,如果中国的年轻人中出来几个本土的技术天才,将会成为中国AI领域的一个突破点,这可能在两三年内会出现。
华人在AI领域的优势是很早就开始的。闫俊杰认为,AI最重要的能力,一是足够聪明,其次是数学和编程较好,第三是需要非常长时间的努力。“具备这三种特点的人很多是中国人”。
据MacroPolo发布的《全球人工智能人才追踪调查报告 2.0》,来自中国的顶尖AI研究人员占比在2019年到2022年间,从29%提升到了47%。
对未来,闫俊杰保持乐观,他认为,AGI整体的社会价值越来越大,头部公司的收入增长也很快,这是一个确定性的事。此外,真正在这个浪潮里参与的模型公司越来越少,“一年多以前还是百模大战,现在其实已经只有几家公司了,很多背景、履历好以及资金雄厚的都放弃了。”
闫俊杰认为,明年做大模型的公司或许会更少。因此,在一个越来越大的市场里,参与的人越来越少,只要能持续迭代带来好的产品、证明自己的价值,钱就不是最重要的问题。
目前大模型还没到存量竞争的地步,未来也不会是一两家模型通吃。“现在没有哪个模型是所有领域最好的,不同的模型有不同的特点,用户也会有不同的选择和取舍。”闫俊杰举例提到,OpenAI是推理和对话能力最好,Anthropic的模型是代码和Agent能力较好,谷歌是多模态能力较强,而中国的模型在效果上或许差5%,但是成本可能是海外的1/ 10。
闫俊杰认为,“现在还是百花齐放的一个阶段。”大家都会有自己的生存空间,并且随着模型变得越来越强,商业价值也越来越大,整个市场在扩大。
闫俊杰判断,AI行业不是互联网的延续,移动互联网时代的分工并不适合AI行业,大模型时代真正的产品是模型本身。未来,无论是产品经理,还是开发、算法,大家的边界都会变得越来越模糊。未来最核心竞争力是想象力,谁有最好的想象力、最能坚持,谁对社会价值大,就会成功。