腾讯混元开源“极小”模型,实际存储仅占用600MB
创始人
2026-02-10 17:21:56

新京报贝壳财经讯(记者罗亦丹)2月10日,腾讯混元开源面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,该模型基于1.8B参数的小尺寸模型,通过2Bit量化技术,等效参数量约为0.3B,实际存储占用仅约600MB,比常用的一些手机应用还小,实现了端侧部署的新突破。

该模型基于混元团队首创的产业级2Bit端侧量化方案,通过对HY-1.8B-Instruct模型进行2比特量化感知训练(QAT)产出,模型大小减少至原始精度模型的1/6,同时在真实端侧设备上生成速度提升2-3倍,可大幅提升使用体验。能力上,模型还保留了原版的思维链,可以为不同复杂度的任务提供相应深度的推理过程。这是业界首个实现2bit产业级量化的端侧模型实践。

随着大语言模型普及,如何将模型在手机、耳机或智能家居等设备上应用,成为业界难题,尤其是不少应用对模型的离线部署、私密性等都有更高的需求,这就需要更多能够在端侧运行的又小又强的模型。目前,模型已在开源模型社区Huggingface和Github上线。

编辑 杨娟娟

校对 柳宝庆

相关内容

热门资讯

米兰冬奥会美国现眼了 转自:京报网_北京日报官方网站 【#米兰冬奥会美国现眼了...
招兵买马!马斯克:SpaceX... (图片来源:摄图网)2月8日,马斯克在社交平台X上发帖表示:"是时候大规模重返月球了"。这是Spac...
中芯国际第四季度净利大增23% 记者丨曾静娇 彭新编辑丨金珊2月10日,中芯国际发布的业绩快报显示:2025年第四季度营业总收入17...
智通港股通活跃成交|2月10日 2026年2月10日当天,腾讯控股(00700)、阿里巴巴-W(09988)、长飞光纤光缆(0686...
先导智能港股暗盘收涨6.1% ... 观点网讯:2月10日消息,锂电池设备制造商先导智能将于2月11日在港交所主板挂牌。暗盘交易数据显示,...