腾讯混元开源“极小”模型,实际存储仅占用600MB
创始人
2026-02-10 17:21:56

新京报贝壳财经讯(记者罗亦丹)2月10日,腾讯混元开源面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,该模型基于1.8B参数的小尺寸模型,通过2Bit量化技术,等效参数量约为0.3B,实际存储占用仅约600MB,比常用的一些手机应用还小,实现了端侧部署的新突破。

该模型基于混元团队首创的产业级2Bit端侧量化方案,通过对HY-1.8B-Instruct模型进行2比特量化感知训练(QAT)产出,模型大小减少至原始精度模型的1/6,同时在真实端侧设备上生成速度提升2-3倍,可大幅提升使用体验。能力上,模型还保留了原版的思维链,可以为不同复杂度的任务提供相应深度的推理过程。这是业界首个实现2bit产业级量化的端侧模型实践。

随着大语言模型普及,如何将模型在手机、耳机或智能家居等设备上应用,成为业界难题,尤其是不少应用对模型的离线部署、私密性等都有更高的需求,这就需要更多能够在端侧运行的又小又强的模型。目前,模型已在开源模型社区Huggingface和Github上线。

编辑 杨娟娟

校对 柳宝庆

相关内容

热门资讯

中信建投:算力板块为何波动加剧... 智通财经APP获悉,中信建投发布研报称,近两周算力板块主升但波动加大,监管加强、资金止盈及美韩AI产...
优秀历史建筑,如何装下全龄友好... 一座优秀的历史建筑,除了光阴沉淀的美,如何“活在当下”? 近日,澎湃新闻记者探访上海部分优秀历史建筑...
德国留学|如何快速交到外国朋友... 很多刚来德国的新生,都有一个共同困扰: 身处多国留学生圈子,想拓宽社交圈、练口语、了解不同文化,却不...
原创 解... 前几天,官方发布了一组陆航部队夜间训练的照片。标题很有画面感——“夜幕沉沉、铁翼飞旋”。说的是第71...
教师来信 | 一位小学教师的期... 尊敬的《教育家》新媒体编辑: 您好! 教育监督制度的初衷,本是为教育纠偏、为学生护航。但近年来,随着...