不到15万元!清华90后团队发布“褐蚁”一体机,已支持阿里最新Qwen3模型|钛媒体AGI
创始人
2025-04-30 22:36:40
0

来源:钛媒体

行云集成电路创始人、CEO季宇

4月30日消息,钛媒体AGI获悉,清华90后创立的北京行云集成电路有限公司(简称“行云集成电路”)宣布,推出全新的一体机产品“褐蚁”,仅需最高15万元就可以跑满血版DeepSeek R1/V3大模型,并且对话速度达到了20token/s。

今天下午,行云集成电路创始人、CEO季宇对钛媒体AGI表示,目前“褐蚁”一体机已经支持阿里最新发布的Qwen3系列开源大模型,包括顶配版Qwen3-235B-A22B。

具体来说,“褐蚁”一体机有三款不同的配置:最高性价比的“超大杯”褐蚁HY90,搭载双路AMD EPYC 9355服务器、24条 48G 6400M频率内存和NV 5090D计算卡,支持FP8、INT4两种数据精度,在FP8精度下跑满血版DS能达到21token/s的对话速度,在INT4精度下则能达到28token/s,最高支持128K的上下文,售价14.9万元;此外,行云集成电路还将推出“大杯”褐蚁HY70、“中杯”褐蚁HY50两个配置版本。

季宇团队表示,行云通过对推理引擎的独家优化提升了推理效率,是国内首个在10万价位提供满血FP8精度模型20+tps速率的一体机产品,并且可配置各类调用大模型API的应用。

据悉,行云集成电路成立于2023年8月,其核心团队主要来自清华大学及全球顶尖芯片公司,致力于研发下一代针对大模型推理场景的高效能GPU芯片,创始人包括季宇,以及公司CTO余洪敏。

其中,31岁的季宇是清华大学物理本科、计算机体系结构方向博士,也是“华为天才少年”之一,主攻体系结构、AI芯片方向。而在华为期间,季宇曾是海思昇腾芯片编译器专家,负责多个昇腾编译器项目,同时作为研究科学家,展开AI编译器领域和处理器微架构域诸多挑战性问题攻关;类脑计算机体系结构《自然》论文共同一作,中国计算机学会CCF优博奖获得者。

2024年11月,行云集成电路宣布完成总额数亿元的天使轮及天使+轮融资,投资方包括智谱AI、仁爱集团、中科创星、奇绩创坛、水木清华校友基金、嘉御资本、春华资本、同创伟业、峰瑞资本等机构。

季宇早前表示,当机器的门槛低到消费级可以接受的成本,边际成本承担的商业模型也会发生变化,带来进一步的产业繁荣。如果计算机体系能支撑消费级可以接受的价格享受极致的AI体验,大模型产业会进一步进入一个类似软件行业零边际成本的超高速爆发期。

事实上,目前多家芯片、服务器、云计算、运营商、AI Infra等领域的公司都发布了DeepSeek一体机产品,堪称“百机大战”,但其中可以运行满血版DeepSeek-V3/R1模型的企业并不多,目前国产GPU芯片层面主要有壁仞科技、摩尔线程等。

据第一财经引述券商数据,预计到2027年,国内一体机的市场规模将超过5000亿元,超过30家企业已向市场推出了一体机产品。

一位行业人士早前对钛媒体AGI表示,一体机核心解决的是部署易用性问题。相比复杂的云计算解决方案,项目落地周期更快、私有化安全性更高、价格更有性价比,但DeepSeek一体机比较大的问题在于持续维护、升级以及大规模数据调度等,以及一体机综合使用成本没有办法复用。

“从当年数据库年代,一体机就兴起,这个大家非常喜欢,但不同的一体机,里面的东西差别是非常大的。DeepSeek出来以后,DeepSeek一体机爆火,我跟一些领导也聊过,数据中心算力这块卖得特别好,但都是短期租赁,因为本身硬件固定资产的年限也就4到5年。所以,我们可以看到一体机比较大的问题是以后持续性的维护、升级以及大规模数据调度等,比如DeepSeek一体机是很新鲜,但是大模型演进非常快,现在DeepSeek已经不是最领先的了,其他公司也能升上去,而客户本身可能根本没有这方面的技术能力。”上述人士表示,推理一体机只是过渡态产品,最终大模型还是要和云计算进行结合,当整个技术成熟以后,跟多云整合,最后会变成云平台的一部分。

对此,在季宇看来,现在一体机依然能够跑得动超大杯的MoE模型和30b当量的dense模型,后续模型迭代其实还好。据悉,相比其他一体机产品,行云集成电路的“褐蚁”在显存、KTransformers等层面有更多的技术研发能力。

据钛媒体AGI了解,下一步,行云集成电路将自研GPU卡,持续带来更低价格,更高tps体验,并且还将实施由30台褐蚁一体机组成的“蚁群”方案,进一步发挥分布式系统优化能力,或将支持500-1000的有效并发数,而价格有望降至300万-400万元——低于英伟达HGX H200集群的整体硬件成本。

钛媒体AGI分析认为,从整个商业市场的视角来看,当前国内有很多人都投身于一体机、AI Infra,以及GPU服务器等类似算力“卖水人”工作。随着推理模型技术迅猛发展,大规模算力投入被质疑,所以国内 AI 算力行业是否将如同AGI基座模型市场一般,经历大浪淘沙后最终仅剩下大厂及头部的几家企业,还是说依然会有更多人“卷”性价比,这一点仍有待进一步观察。

根据规划,季宇的最终目标是:为AI构建x86,目标是让AI PC与互联网底座重回组装机模式(PC及服务器),将组装机打造成 AI 基座,低成本搭建高端大模型,激活AI服务器组装机体系,让大家能组装出支撑高端AI应用的设备,带动体系运转。

(本文首发于钛媒体App,作者|林志佳)

特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。

相关内容

热门资讯

哈里斯也发声了:特朗普政府的关... 美媒:哈里斯发表卸任后首次重要演讲,批评特朗普政府关税政策“鲁莽”据美国哥伦比亚广播公司(CBS)等...
杭州湾跨海铁路大桥南航道桥进入... 转自:中国交通新闻网4月29日,由中交二航局承建的杭州湾跨海铁路大桥南航道桥首个主塔塔座及塔柱第一节...
硬核数字绘就“五一”假期“热力... 转自:央视网央视网消息: 5月1日是“五一”假期第一天。记者从交通运输部了解到,“五一”假期预计全社...
物产中大:2025年一季度净利... 中证智能财讯物产中大(600704)4月29日披露2025年第一季度报告。公司实现营业总收入1331...
假期首日 陕西铁路预计发送旅客... 假期首日,陕西铁路迎来旅客出行高峰。今天(5月1日)是“五一”假期第一天,起点新闻·西部网记者从中国...
200+活动,五一来临沂开启欢... 转自:临沂发布“沂蒙山小调诞生地民歌演绎、2025临沭麦玩娱乐节、奇遇三星堆VR沉浸探索展”……这个...
中贝通信:2025年一季度净利... 中证智能财讯中贝通信(603220)4月29日披露2025年第一季度报告。公司实现营业总收入5.49...
安孚科技:2025年一季度净利... 中证智能财讯安孚科技(603031)4月30日披露2025年第一季度报告。公司实现营业总收入13.7...
【品牌】荣耀新款MagicBo... 昨日荣耀举行了笔记本电脑新品发布会,带来了全新MagicBook 16,来简单看下配置价格。据介绍,...
“五一”财报细读|白酒公司20... 编者按A股市场2024年年报和2025年一季报业绩披露已收官。正逢“五一”长假,证券时报记者精选了几...
“五一”假期首日,河南多段高速... 5月1日,记者从河南气象了解到,今天白天到夜里,全省晴天间多云。全省偏西风转偏南风3到4级,西北部、...
ST华鹏:2025年一季度净利... 中证智能财讯 ST华鹏(维权)(603021)4月29日披露2025年第一季度报告。公司实现营业总收...
巍华新材:2025年一季度净利... 中证智能财讯巍华新材(603310)4月29日披露2025年第一季度报告。公司实现营业总收入1.91...
天风证券给予中国化学买入评级 天风证券05月01日发布研报称,给予中国化学(601117.SH)买入评级。评级理由主要包括:1)业...
登顶泰山最高奖金3万?警方出手... 据“公安部网安局”4月30日晚消息,近日,“登顶泰山奖金最高3万”“有奖登山”等信息在互联网广泛传播...
放假回微信到底算不算加班?法院... 来源:浙江在线 休息时间用微信回复工作算加班吗?2021年,李女士入职某公司,双方签订了固定期限劳动...
5月1日至3日,隋唐大运河文化...   刚刚,“隋唐大运河文化博物馆”微信公众号发布公告称,5月1日、5月2日和5月3日隋唐大运河文化博...
刚刚预警:马上影响上海!降雨突... 假期第一天你出游了吗?今天,多云到阴开场。早间全市气温多在18~21℃附近,预计最高气温30℃上下,...
府院联动 打造基层治理新格局 近日,临江市人民法院临江人民法庭庭长深入辖区临江市六道沟镇人民政府,与工作人员交流分享基层治理经验,...
扩散!预约已满,别跑空! 转自:洛阳发布洛阳博物馆关于5月1日、5月2日、5月3日预约已满的提示尊敬的游客大家好:我馆5月1日...