135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?
创始人
2025-05-29 15:41:01
0

机器之心原创

编辑:吴昕

不要抗拒趋势

在微软 Build、谷歌 I/O、 Code with Claude 三大开发者大会接连登场的一周里,微软为 Windows 加装模型上下文协议(MCP),Google Gemini 野心初显「AI 操作系统」,Claude 4.0 高调抢滩编程主战场。

就在这样的节奏下,5 月 27 日,蚂蚁集团的开源团队「接棒」发布了一张《 2025 大模型开源开发生态全景图》。

访问地址:

https://antoss-landscape.my.canva.site

完整项目列表和相关数据:

https://docs.google.com/spreadsheets/d/1av9kitgnRGtsmDp6AbW96m2cCR4jXZFQmUVG2di8Bjw/edit?gid=0#gid=0

这是一张由开源社区数据驱动的技术演进路线图——

135 个社区核心项目、19 个技术领域,全面覆盖从智能体应用到模型基建,系统性梳理了开源力量在大模型浪潮下的集结与演化路径。

其中,模型训练框架、高效推理引擎、低代码应用开发框架成为当前最具主导力的三条技术赛道。

135个项目中位于2025 年 OpenRank 排名Top 20的项目。这里用到了华东师范大学X-lab实验室OpenRank影响力评价指标。

结合前一张图,将 OpenRank 指标与 2024 年数据对比,三大主导技术赛道的同比上升幅度尤为明显。

不要抗拒趋势。」发布现场,蚂蚁开源技术委员会副主席王旭谈及全景图的意义。

比起盲目对标,在一个飞速发展的领域,搞清楚哪些关键领域仍未涉足、哪些路线已经成了技术冗余,对于企业而言更具现实意义。

对于开发者、投资人,尤其是打算「自己干」的人来说,也是一份值得参考的路线图:哪些项目正拾级而上?哪些赛道开始日落西山?关键从来不是起点有多高,而是是否踩准了那条上升通道。

一张快速变化领域的「撕拉片」

这张全景图,像是一张为大模型开源生态拍下的「撕拉片」。在高速运动的行业面前,「咔嚓」定格了 135 个项目的最大「公约数」——

一场直播中的「现实世界的黑客松 (A Real-world Hackathon )」 。

与追求长线的传统开源文化不同,这些项目大多靠热点驱动,短期速成、技术声誉兑现快;反之,随着热点不断迭代,严重依赖热点的项目「埋」得也快。

例如,对应的闭源项目爆火后,Devika、OpenDevin、OpenManus 们在短周期内密集登场并获得极高关注度。

SGLang、vLLM 则代表另一种高频脉动的开发形态——方向明确,剩下的全靠「中美网友 24 小时轮肝」完成;几乎每周都有新版本,生态在极高密度的「卷」中快速升级。

有些项目发展不错,有些项目成功为背后工具链引流,还有的发展为商业项目,如 GPT Engineer 早期积累了⼤量⽤户的明星开源项⽬,后续发展为闭源的商业化产品 Lovable。

一些项目爆发力极强,一度拥有上万 star 的关注度,但也面临高淘汰率和低维护意愿的挑战,最后被「埋」。

除了 swarm 是 OpenAI 官⽅宣布不再维护外,其余项⽬的上⼀次代码提交还停留在 2024 年,实质性开发早已停滞。

如果就此止步,只看到爆款和淘汰,就难以理解为什么这些浪花会出现。推动「黑客松现象」上演的还有更为深层的「地质」动力——

模型能力带来的应用重塑、生态位之间的动态博弈。

以 AI 搜索为例,开源项目集体式微,并非「做得不够好」,而是 GPT-4、Gemini 们已经将联网检索、答案生成「内嵌进模型」,直接抹平了原有的工具价值。

AI Search 开源项目们的 OpenRank 趋势,犹如日落西山

相反,AI Coding 类开源项目则一派繁荣,OpenRank 走势「嘴角上扬」几乎成标配。

这一轮热潮的背后,是 Claude 3.7 Sonnet 等大模型在代码生成与代码理解能力上的集体飞跃,直接重构了「人机协作」方式。

AI Coding开源项目 OpenRank 趋势,几乎个个「嘴角上扬」,蒸蒸日上。

与此同时,生态位之间也在激烈博弈中,变化最剧烈当属 Agent Framework 领域——

Dify、n8n、RAGFlow 等低代码平台工具涨幅显著,高达 72.22%;而与此同时,LangChain、LlamaIndex、AutoGen 等曾经红极一时的SDK范式整体下滑了 35.90%,跌幅居首。

这可能意味着一个转向——

从服务开发者「写代码拼接智能体」,转向更注重用户的「可视化、可定制、业务级可落地」的平台产品。

低代码平台跃升至最顶端,而 SDK 范式则集体「下滑到底」。

看见未来:七大趋势浮出水面

除了生态全景扫描,通过追踪 GitHub 上 135 个核心项目近两年的活跃度、技术走向与社区反馈,报告也归纳出七条值得所有开发者、创业者关注的趋势

前三个聚焦智能体应用层,后四个围绕模型基础设施层

最具体感的趋势都集中在了智能体应用,而且两个都与 Manus 爆火有关。

2025年,Agent 框架热潮褪去。从 2024 年下半年开始,LangChain 等早期 SDK 型框架的热度开始「下台阶」式回落,新框架鲜有涌现,开发者重心悄然转移。而到了 2025 年,Dify、RAGFlow 等低代码工作流平台因契合企业需求迅速崛起(也是从中国开发者社区中生长出来的强势项目)。

Agent框架OpenRank排名前十的变化

如何理解新框架在 2025 年褪潮?在发布现场的圆桌讨论中,几位智能体框架圈的核心研发者表示——

与其说褪去,不如说 Agent 框架来到下半场

过去两年,「上半场」的主旋律是开发者工具:大模型刚崭露头角,各类框架如 LangChain、AutoGen、LlamaIndex 等纷纷涌现,争相为开发者搭建「脚手架」。随着 Agent 流程逐渐标准化,开发者不再需要五花八门的新框架,

恰在此时,Manus 的「一键即用」体验爆火,让业界意识到端到端的极致体验可以为很多用户接受。在「下半场」,Agent 框架更注重应用场景落地,帮助普通用户完成更复杂任务。当然,解决真实场景的任务时需要强化学习,还面临不少挑战(如奖励设计)。

预测同时指出,2025 年低代码平台强势崛起,表明 Agent 框架的竞争从比拼技术范式,走向比拼「谁能更快成为企业的生产力工具」。那些技术节奏稳、商业理解深的开源平台,正乘势成为「 AI 新基建」的领跑者,Dify 就是代表之一。

除了框架圈,Manus 更撬动了「大厂觉醒」,连夜启动配套建设,尤其是标准协议层

MCP 一出,标准协议层正式登场,大厂几乎倾巢而出——

有了它,直接盘活沉淀多年的「互联网家业」,现在一键接入,就能组成一个能办事、能协作的 Agent,触达生活的每一个角落。

紧接着,Google 在 2025 年开源 A2A( Agent2Agent ) 协议,解决 Agent 之间互操作的问题;CopilotKit 又推出的 AG-UI 协议 进一步打通了智能体后端与前端用户。

不过,发布现场的圆桌讨论中,开发者们也指出 Agent 间的协作与传统工具调用很不同——

它往往是一个持续十几分钟乃至更长的「长程任务」,在执行过程中需要频繁与提供方交互。因此,协议不仅要能传递信息,更要支持任务状态的维护、过程控制和动态交互能力。

而目前的 MCP 协议没有涵盖这些能力,A2A 解决的还是「连得上」的问题,「协作」仍是未解之题。这一领域仍有广阔优化空间,也为开源社区留下了巨大的创新机会。

预测也指出,未来需要原生为大模型场景设计的新协议,而在这场技术升级中,开源生态将成为关键阵地。

谁能率先定义这些新协议,并将其与工具链(如 SDK、框架)打通,谁就有机会建立自己的技术闭环,抢占「模型即服务( MaaS )」时代的生态制高点。可以预见,未来一到两年,标准协议层将迎来激烈的生态博弈期。

再来看 AI Coding。写代码是大模型与生俱来的优势,AI 编程项目确实红火,几乎个个「嘴角上扬」。

根据项目的智能化程度(辅助还是完全替代?)以及目标受众群体(专业人士还是普通用户?)的专业化程度,将这些 GitHub 上热门的 AI Coding 类开源项目划分为四个象限。

国内百度、阿里、腾讯、蚂蚁、字节等陆续推出 AI 代码助手,率先跑马圈地。AI Coding 也成为开源生态中少数几个不依赖独占数据、也不被私有场景锁死的活跃赛道。连 OpenAI 都愿意为此砸下 30 亿美元,收购 AI 开发工具 Windsurf,可见这条赛道含金量之高。

如今,AI 代码助手已深度介入整个软件开发流程:从需求理解、系统设计,到前后端开发、测试调试,再到上线与运维。有意思的是,真正「带它上路」的,是程序员自己。但要说全面替代程序员?还远得很。

目前的 AI 编程助手,大致处于「智能辅助驾驶」阶段,能在特定任务上独立作业,比如自动生成前端页面、小程序骨架、测试脚本、代码检查等。

技术演进的关键瓶颈,预测明确指出有两个:一是上下文感知能力( Context-Awareness ),二是领域知识融合( Domain Knowledge Integration )。在未来 24 个月里,AI 助手的「接单能力」会不断增强,但在人机共创的长期范式中,关键决策权,仍牢牢掌握在人类程序员手中

与应用层的「生死时速」不同,一旦「下沉」到基础设施,趋势变化更像是静水深流。

ChatGPT 和其他大语言模型的爆火,一度把「泼天的富贵」砸向了向量数据库,一时间风头无两。但热潮也很快退去,发展趋势逐渐趋于平稳。最近两年,它们既没被「拍死」,也没卷出新高度,更多是以「相敬如宾」的姿态各自发展。

有关「向量数据库是不是伪需求」,一直争议不断。从当前的稳定趋势来看,它可能确实是一项真需求。

向量数据库的每月 Star 增量变化

预测指出,技术「厚不厚」不是重点,关键是有没有持续迭代的范式空间。对向量数据库来说,短期看是稳定期,但中长期是否能迎来「第二曲线」,还要看 AI 生态新场景的开拓速度。

发布现场的圆桌讨论中,Zilliz 合伙人、技术总监栾小凡还提到一个很有意思的点——

向量数据库不仅是模型应用阶段的「召回引擎」,也正在成为训练流程中的「数据发现器」。

如在自动驾驶场景中,如果模型在「红灯前突然窜出一只狗」这类边缘案例中表现不佳,就需要通过数据回溯找到类似样本,进一步强化训练。但这类数据往往来自非结构化源,如网页爬虫、文本、视频等,难以通过传统标签化方式精准搜集。

此时,向量数据库的价值就体现出来了——

它能帮助我们高效从海量异构数据中,按语义相似性快速定位相关样本,从而实现更精准的「问题驱动式数据提取」,支持面向真实任务场景的精细化训练。

谈到大模型训练和推理,我立刻想到「源神」DeepSeek 的一段话:

我们非常感谢开源生态系统,没有它,我们不可能在通用人工智能 (AGI) 方面取得进展。我们的训练框架依赖于 PyTorch,我们的推理引擎基于 vLLM,这两者都对加速 DeepSeek 模型的训练和部署起到了重要作用。

要说 PyTorch,人人都承认它的领先,但没想到它居然领先到了「一统江湖」的地步。

而一旦进入推理环节,很多开发者都关心一个问题:性能被拉到一个新高度,怎么提高模型的推理速度?2023 年以来,出现了一大波面向于模型部署和高效推理的大模型服务工具,在性能和生态上彼此追赶,混战一直持续到今天。

眼下,vLLM 与 SGLang 已是当之无愧的「推理顶流」,社区影响力持续扩张。

从 Top 10 的模型服务项目的排名变化上来看,仍有新的项目不断冒出来,并吸引开发者参与到其中去。例如去年 7 月清华推出的 KTransformers 和今年 3 月 NVIDIA 推出的 Dynamo。

几大模型服务项目的 OpenRank 曲线变化

2023 年 6 月,vLLM 首次发布,被视为大语言模型推理的分水岭:在不改动模型结构的前提下,它显著压缩显存占用、提升并发能力,是首个对 LLM 推理进行系统级重构的开源引擎。2025年,vLLM 发布 v1,完成核心架构升级后重回增长通道,依旧是主流部署场景中的首选框架,并具备更强的商业集成度。

SGLang 属于后者居上—— 2024 年 1 月发布,定位更贴近真实 Agent 应用场景,不仅具备更强的 GPU 并发调度能力,还支持多步推理优化。2025 年一季度,其 OpenRank 增长达 31%,远超同期 vLLM 的 17%。

SGLang 也被用于重写 Grok 2 推理技术栈,极大改善了产品体验,甚至获得马斯克的公开点赞。

有个细节,「一招鲜」也有高光时刻。

2025 年 2 月,清华大学 KVCache.AI 团队推出的 KTransformers 破解千亿级大模型本地部署难题,4090 单卡实现 DeepSeek-R1 满血运行。

该项目 OpenRank 飙升 34 倍,吸引 736 名开发者参与协作,GitHub Star 数突破 1 万。看来在大模型时代,哪怕是底层细节的优化,也可能带来「超级红利」

最后,在多模态数据治理技术的演化上,湖仓「四足鼎立」, 为大模型所依赖的非结构化海量数据提供更强的存储与管理能力。元数据治理也开始拥抱非结构化数据和 AI 资产管理。

不过,Data Infra 发展了二十年,发展得非常完善,有自己的方法论。而多模态原生数据 Infra 才刚刚开始,用新的方式再做一遍时,Data Infra 遭遇过的痛点可能会再度出现。

数据湖表格式项目 OpenRank 曲线变化

元数据治理项目 OpenRank 曲线变化

「撕拉片」的方法论

为什么要做这份报告?王旭回答很直接——

蚂蚁的开源团队其实不叫「开源办公室」,而是「开源技术增长」,一个立足架构层的技术中枢,希望通过对开源社区的长期观察,为蚂蚁内部的技术路径提供决策支持。

相比 Gartner 这样的传统商业分析,开源社区数据能更早、更真实反映技术的风向变化。

为构建这张「撕拉片」,团队以 PyTorch、LangChain、vLLM 等 AI 明星项目为起点,层层扩展其技术上下游,并邀请行业专家讨论,一步步收敛出百余个活跃度与影响力兼具的核心项目。

真正支撑判断的,是 OpenRank——由华东师范大学 X-lab 开发的开源影响力指标。这次入选门槛是:2025 年 1 至 4 月的 OpenRank 月均值 ≥ 10。太旧、太新的项目都可能被筛掉。为了观察趋势,团队重点对比了项目和赛道的 OpenRank 均值变化。

发布会上,王旭还透露报告将在下半年推出更新版本。届时,低代码平台是否还能保持狂飙?协议层会否冒出新变量?AI Coding 是否还有惊喜?......

这场黑客松直播,还在继续。

相关内容

热门资讯

潘虹前夫米家山:我能接受她的绯... "人生最大的遗憾,不是没登过高山,而是登顶时身边无人共享风景。" ——这或许能概括导演米家山的一生。...
开播2集8.7分,今年韩剧真杀... 今年韩剧真是嘎嘎乱杀。不到半年,已经出了不少高分佳作。前有IU的《苦尽柑来遇见你》,后有申敏儿的《恶...
李双江家庭风波再起,出狱后的李... 今年已经85岁的老艺术家李双江,近来,被爆在海南频频演出的消息,引起了广泛关注。本该享受晚年的他,应...
从陈晓旭到朱媛媛,那些被癌症带... 2025年5月21日,一个很平常的小满日。上午10点57分,演员辛柏青发了一条微博,震惊了世人。那是...
全面,任嘉伦主演影视作品20部... #任嘉伦小苏之前写了任嘉伦的5大代表作,就有人私下问小苏,说任嘉伦还有很多好看的电视剧。有没有那种总...
撕疯了!贝克汉姆儿子放料大骂爹... 最近,贝克汉姆夫妇和大儿子布鲁克林之间的大戏是越来越夸张了——现在已经发展到双方都开始往媒体里放料的...
黄仁勋谈中美AI竞争:中国的D... 北京时间5月29日凌晨,英伟达CEO在财报电话会上说,来自中国的DeepSeek 和 Qwen(阿里...
HBO的爆款美剧也翻车,被观众... 《最后生还者》终于更新完了。口碑彻底稀碎,最后一集IMDb仅6.7分,豆瓣也从首季的9分,一路干到了...
艳压赵露思、欧阳娜娜,虞书欣“... #夏日生活打卡季#最近你优又剧荒了,每天都在摸鱼蹲电子榨菜《灿如繁星》快点上线!毕竟这段时间,网上铺...
成都堵到红得发紫!川AG大军已... 端午假期即将启动! 此时此刻 成都车流高峰已出现! 哪些路段会堵? 提前知悉↓↓ 5月31日至6月2...
恒拓开源发生大宗交易 成交折价... 恒拓开源(834415)5月30日大宗交易平台出现一笔成交,成交量49.66万股,成交金额600.3...
《藏海传》:演六初的白冰一出手... “白冰一出手,内娱小花都得靠边站!”39岁的白冰姐姐在《藏海传》里演了个勾魂师父,直接把观众看懵了。...
程成高烧晕厥住院后续:康复出院... 主持人程成出院了,大家悬着的心可以放下了。5月26日,53岁的程成生病住院的消息登上了热搜,引发网友...
“银色单品”今年太流行了!这4... 在色彩不断被解构重组的时尚循环里,银色不声不响地闯入了夏天。它不再只属于舞池、夜晚或节日,而是以一种...
播1集全国前3,央视历史大剧爆... 有这么一部剧,晚上九点半才开播,仅仅1集就冲上了全国前三。怎么,还有高手?就在昨晚,20集(原本30...
今年夏天,穿得越放松越好看! 静坐、听雨、读书、莳花、寻幽望云、候月、尝酒、品茗、避暑将生活的繁忙纷杂暂时搁置一处,穿上如风一般舒...
《折腰》收官:“4人零差评3人... 最近是不是总有人在你耳边念叨《折腰》?热搜刷了十几遍,弹幕一水儿的“啊啊啊我嗑疯了”,甚至连你那个只...
央八开播!36集反腐大剧来袭,... 文案|一十三编辑|苏打水该有一部反腐大剧出现了。这类题材在国产剧市场上爆款频出。前有《人民的名义》凭...
收手吧导演,别再侮辱观众智商了... 文 | 安青编辑 | 9527喵咕君短剧几乎已经成为一个能与长剧抗衡的新鲜赛道。随着一部部短剧爆火,...
原创 全... 分区洗护再获家电巨头重磅动作加持!5月30日,在“不只是三筒”海信洗衣机新品纯享会上,海信洗衣机对外...