千问闯入田间地头_热点

千问闯入田间地头

创始人

2025-07-21 18:58:21

0次

来源：光子星球

大模型也不得不脱下孔乙己的长衫。

在乡亲们的第一堂AI工具课上，尽管他们不知道腾讯元宝为何物，但表现得极为踊跃，“能劝和婆媳吵架不”“娃不肯结婚咋办”。就在几百米外，墙上刚刷上“母猪产后护理，问腾讯元宝”的广告语。

阿里通义千问也跟养猪较上了劲儿，从体温检测、饲料配比到疾病预警，号称要用算法掌控每只猪的一生。在同一片土地上，有人利用通义千问开发“农业农村法律政策”大模型，还有人在通义千问的基础之上精调出“水稻种业”大模型。

各行各业对大模型的渴望远超想象，开源的DeepSeek和Qwen成为了主要的推动力量之一。据统计，2025年上半年，有196个超10万元的DeepSeek政企项目在全国铺开。没有花活儿，“DeepSeek+Qwen”落地教育、医疗、政务等领域成为了最优解。

从城市实验室到农村田头，通义千问们“下乡”的背后，一方面充斥着大模型公司验证场景和商业化路线的急迫性，另一方面也挤满了怕被时代抛弃的人们。

中国大模型有专属于自己的道路，既要跻身于一流，也要接地气儿。进一步可拆解为，在国际榜单上Kill对手，在业务上吃掉客户。

榜单无限游戏

大模型哪家强，榜单成绩说了算。

DeepSeek-R1的出圈给了人们最直观的感受，中国大模型也扬眉吐气了一回，有底气和OpenAI、Anthropic这类绝对头部一决高下。

DeepSeek用低成本和高效率，实现了R1在数学、代码自然语言推理等任务上，性能比肩OpenAI o1正式版，DeepSeek-R1也由此成为了衡量国内大模型的“试金石”。

阿里通义千问早在2023年就走上了开源的路线，拥有国内最全尺寸、模态的大模型全家桶和完备的生态。从最初对标LIama系列到超越DeepSeek-R1和OpenAI o1，开源的阿里Qwen3迎来了自己的高光时刻。

今年4月29日，阿里正式开源通义千问模型Qwen3，其参数量仅为DeepSeek-R1的1/3，部署成本仅是满血版R1的25%-35%。在模型部署成本大幅降低六到七成的情况下，Qwen3超越了R1、OpenAI-o1等全球顶尖模型。

Qwen3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强，创下当时所有国产模型及全球开源模型的性能新高。

具体来看，在奥数水平的AIME25测评中，Qwen3斩获81.5分，刷新开源纪录；在考察代码能力的LiveCodeBench评测中，Qwen3突破70分大关，表现甚至超过Grok3；在评估模型人类偏好对齐的ArenaHard测评中，Qwen3以95.6分超越了OpenAI-o1及DeepSeek-R1。

可以说，在一段时间内，Qwen3顺利完成了DeepSeek-R1的接棒。我们了解到，很多企业面临无法激活满血版R1的情况，因此全尺寸、全模态的Qwen3系列成为了落地场景的选择。更多情况下，企业选择两者都要，Qwen3与R1优势互补，被打包进垂类场景解决方案里。

据智能超参数统计发现，性能突出且开源的DeepSeek、Qwen等开源大模型的出现，一定程度上改变了金融机构的采购重心，给大模型To B行业带来了改变。此外，DeepSeek、Qwen开源后，还导致了算力采购需求的激增，这都从侧面证明了模型能力的重要性。

聚光灯之外，对标OpenAI，通义千问还做了很多动作来弥补Qwen3的不足：通义实验室RAG团队开源了WebDancer模型，可从零训练一个DeepResearch类智能体；开源WebSailor模型，增强网页检索和复杂推理能力。

榜单即战场，“红皇后效应”日益凸显，为了保持排名，玩家必须不断奔跑。DeepSeek-R2蓄势待发，沉寂已久的MiniMax和Kimi紧随其后。模型榜单排名游戏似乎没有终点，技术迭代、榜单扩容、评测维度变化，让“第一”的头衔永远只是暂时的胜利。

市场份额之争

在大模型技术迭代放缓之前，榜单仍有存在的价值。当下而言，大模型榜单排名直接影响AI公司的融资估值和客户信任度。

榜单算得上大模型的第一张名片，背后直接关系到大模型市场份额的竞争。据一篇关于“2025年上半年大模型API市场数据分析帖子”，大模型市场份额方面，谷歌以43.1%的份额稳居第一，DeepSeek和 Anthropic分别以19.6%和18.4%的份额占比位列第二和第三。

谷歌“量大管饱”“全覆盖”的策略，令其在市场（特别是文本翻译领域）占据了绝对优势。DeepSeek虽属于后起之秀，但在开源、性能优势的加持下快速追赶了上来，自DeepSeek-V3发布以来，一直保持着一定的市场份额，并且在持续扩大。

Qwen3因为比DeepSeek慢了一步，没有吃下这波开源的红利。截至今年上半年，通义千问（Qwen）系列模型仅占据了1.6%的市场份额。

DeepSeek的市场份额扩大，似乎表明大模型的竞争格局尚未成型。即只要模型得到市场认可，就有可能与巨头抗衡，今天是DeepSeek，明天就有可能是通义千问。

这也解释了MiniMax、Kimi举公司之力突破和开源最新大模型能力的原因，这些公司也想吃下一部分大模型细分市场份额。成为OpenAI、谷歌的“高仿”也在考虑范围内，比如最近就已经有开发者用Kimi K2模型来替代Claude 4的某些功能，其核心优势就在于免费、开源。

比起创业公司的单点爆破，国内通义千问的赢面或许更大。大模型市场份额比拼的是长期竞争力，无论是开源还是闭源，大模型能力都得保持一直更新中，稍有不慎就面临着掉队的风险。

一个典型的例子是LIama，LIama2、LIama3此前在开源社区声量很高，但后期模型能力差强人意，被同样开源的DeepSeek取而代之。MiniMax、Kimi等公司缺乏持续开枪的弹药，受IPO的压力，也许很难保证连续性的突破式创新。接下来中国大模型市场份额的竞争，角逐者仍锁定在DeepSeek和通义千问之间。

魔搭开发者大会上，通义千问负责人林俊旸透露，通义千问将继续在强化学习方向探索，从大模型训练时代迈入智能体训练时代。多模态是其中一个重点方向，Qwen下一代VLo已经在路上，目前已有一些阶段性进展，多模态模型的生成和理解统一是现在的目标。

大模型下沉

大模型烧钱换来榜单的一席之地，最后总得有人来买单。

现在模型厂商推进商业化路线大致有两种。

一种是拿下各行业大客户，打造标杆，以此来吸引同行业其他潜在群体。阿里通义大模型已经服务了商业银行、互联网公司、手机品牌、家电龙头、高校及科研院所、汽车行业等客户。

另一种是做To B定制化单子，主要面向政企类客户，交付包括算力、大模型、智能体应用在内的一体化解决方案。

以上两种路径的共同点是，由通义方来主导，自上而下地推动大模型落地。同时，光子星球注意到，除了头部大客户外，大模型下沉的趋势越来越明显，不少团队正在主动集成通义千问大模型，在此基础上落地应用。

“农法千问”大模型是以农业农村法律政策为主要内容的AI大模型，通过集成通义千问技术，将晦涩法规转化为方言问答，来提升农民法律意识。同样在农业领域还有相关论文在讨论，通义千问参与设计灌溉系统、土壤改良方案的可行性。

此外，在河南、重庆等地的乡村，百度千帆平台正推动“大模型下乡”计划，帮助村民便捷处理医保缴费、户籍办理等琐碎事务。还有一些城市和县域，研究AI公务员上岗、大模型种植荔枝和AI养猪，这些是比乡下“刷墙”更实在的大模型渗透方式。

总体而言，中国大模型已经走过了炫技和参数比拼的时代，剩下的只有解决一个个行业问题。

互联网大厂的下沉市场竞争由来已久。

阿里曾在2017年推出ET农业大脑技术，将AI与农业深度结合，形成从生猪养殖到经济作物的全场景解决方案。在“热土计划2024”中加大投入、提供专项基金，联合多方共建乡村可持续发展实验室。在此基础上，大模型全线向下渗透不过是时间问题。

对下沉市场而言，中国模型具有本土优势。在中文语境、方言理解上的本土化能力，比国际模型更适配县域需求。一些轻量化模型和MoE架构降低部署成本，更适合于算力薄弱地区。在这个过程中，通过与G端和B端企业的合作，还能撬动C端应用入口的下沉，让“母猪产后护理，问腾讯元宝”不再流于口号。

大模型的商业化之路，正从高悬的“技术神坛”走向广袤的田间地头。

榜单排名竞争固然重要，但未来大模型的价值将在，用方言解读法律条文的村口，在AI测算灌溉流量的水渠边。

特别声明：以上内容仅代表作者本人的观点或立场，不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的，请于上述内容发布后的30天内进行。

上一篇：康弘药业：目前生产经营活动正常，不存在应披露而未披露的重大事项

下一篇：平安中证消费电子主题ETF发起式联接季报解读：份额申购赎回变动大，基金利润下滑明显

千问闯入田间地头

相关内容

热门资讯