(文/潇冷)大家好,这里是《AI谈》,在这里我们一起谈AI。在本文开始之前,笔者想先请各位思考一个问题:DeepSeek为何能够迅速走红?难道仅仅是因为它“易用”、“好用”、“耐用”这些特点吗?在众多大模型中,比如chat-GPT、豆包、通义千问等,难道就没有能与DeepSeek相媲美的吗?
没有大模型能与DS媲美吗?
答案显然是“不是”,当然这也并不是笔者一个人“口嗨”。在全球知名的AI模型评测平台Chatbot Arena于今年2月份公布的最新一期榜单(Chatbot Arena LLM Leaderboard)中。谷歌Gemini-2.0、ChatGPT 4o、DeepSeek-R1、o1、Qwen2.5、DeepSeek-V3等均名列前茅,能够与DeepSeek-R1、DeepSeek-V3一较高下的大模型并不少,唯独DeepSeek火得一塌糊涂。
榜单:媲美DeepSeek有的,但是国内媲美DeepSeek的貌似只有通义千问
为何DeepSeek爆火?笔者始终坚信,DeepSeek的最大魅力在于其开源特性,这也正是吸引大模型产业链上下游厂商纷纷侧目的关键所在。毕竟,在国内大模型市场这片热土上,尽管过去两年里热潮涌动,但真正实现盈利的却寥寥无几。在紫光云紫鸾6.0发布会上,紫光云公司总裁王燕平向中关村在线透露,基于DeepSeek的大模型训推一体机售卖得异常火热。
360集团创始人周鸿祎在接受采访时,坦言,DeepSeek最大的成果不仅是让中国大模型在技术上赶上了美国大模型,同时在中国用户、企业和政府中做了一次人工智能的普及教育。他认为,由于DeepSeek免费、开源等特性,政府和企业纷纷开始采用DeepSeek降本增效,加速了中国AI产业革命的爆发。换言之,以往企业只能独自研发并训练自己的大模型,而如今有了DeepSeek,企业可以在其基础上进行二次开发,或者进行微调以满足自身需求。
Manus又是何方神圣?
Manus突然爆红,短视频、朋友圈里满是它的相关消息,连“邀请码”都炒得炙手可热,价值倍增,甚至有“媒体”将其比喻为“第二个DeepSeek”。在这里,笔者还是想强调,DeepSeek真正价值不仅仅是能力,更为重要的是“开源”。同时,Manus官方介绍,Manus能够独立思考、规划并执行复杂任务,直接交付完整成果,支持在简历筛选、房产研究、股票分析、旅行规划、网站SEO优化等场景应用。嗯?他说你就信?都用过吗?像极了爱情的模样!
用互联网“造”产品的成本确实低。回想当年,微软为了保护自己的系统免受攻击,付出了巨额的成本,硬是把自己打造成了一家安全公司。而如今,Manus只需一份PPT,一场发言,就能引起广泛关注,真是天壤之别。闹到最后,Manus相关负责人称,团队正在尽力改善内测用户体验,在模型幻觉、交付物友好度、运行速度等方面仍有很大提升空间。在笔者看来,Manus实测结果不如人意,其宣传过头了。
虽然说发展是否定之自我否定,但我们不能完全否定Manus所做的贡献。零一万物技术负责人在接受新京报采访时表示,相较于去年Dify的工作流,或是Agently这类框架而言,Manus更符合智能体定义的Agent。但从模型发展角度来看,目前是补足模型能力不足的一个中间态。未来模型将会持续发展,覆盖所有Agent产品。Manus的最大意义是定义了一个AGI的产品形态,预计3月底前,市场上会出现沿着Manus产品思路或者功能开发的其他产品。
言外之意,DeepSeek可以参考Manus的形态进行进化。Manus在褒贬不一的攻势下,仿佛也杂事缠身。3月7日,Manus联合创始人兼首席科学家季逸超发文称,Manus的官方X账户被意外暂停,正积极与X的支持团队合作解决此事。初步观察表明,暂停可能与第三方提及加密货币诈骗有关,该领域与Manus的运营完全无关。季逸超还澄清,Manus从未参与加密货币项目、代币发行或区块链计划。
Manus爆火,别影响千问
令笔者遗憾的是,3月6日的热点几乎全被Manus所垄断,而由DeepSeek引发的开源大战,尽管有阿里巴巴这样的行业巨头倾情参与,却似乎并未获得足够的关注。就在这一天,阿里云发布了一款更小尺寸、性能却比肩全球最强开源推理模型的QwQ-32B。
阿里云称,这款QwQ-32B模型拥有320亿参数,其性能竟能与具备6710亿参数的DeepSeek-R1相媲美。发布当天,赞誉之声便接踵而至。据财联社报道,全球最大的AI开源社区Hugging Face更新了其大模型榜单,QwQ-32B成功荣登榜首。
据了解,千问QwQ-32B在数学、代码及通用能力上均实现了质的飞跃,整体性能与DeepSeek-R1不相上下,更突破性地让高性能推理模型得以在消费级显卡上实现本地部署,大幅降低了模型的应用成本。
事实上,阿里云开源QwQ-32B模型对于国内大模型的发展而言,其意义远非止于此。这一系列的开源举措,无疑将极大地促进基于国产大模型的二次开发及模型微调的生态壮大,DeepSeek、阿里巴巴、百度等巨头纷纷抢滩登陆,展开激烈角逐。
尤为值得一提的是,百度也在积极布局大模型领域。2月28日,百度官方宣布其文心大模型4.5将于3月16日正式发布,并透露这一代模型在基础能力上实现了大幅提升,同时具备了原生多模态、深度思考等前沿能力。据悉,这将是百度迄今为止最强的下一代大模型。而早在2月14日,百度就已透露将在未来几个月中陆续推出文心大模型4.5系列,并计划于6月30日起正式开源。
开源之战的号角已经吹响,让我们忘掉那些插曲,共同见证这场技术盛宴。
本篇为《AI谈》栏目的第三篇文章,原计划这期写“大模型安全”,但Manus有点突发,让人始料未及。抱歉,在下期文章里,笔者也将谈一谈“大模型引发的安全问题”。感谢大家阅读。
(9569519)