诳时惑众网

腾讯混元开源“极小”模型,实际存储仅占用600MB

来源:诳时惑众网-工人日报
2026-04-27 04:01:01

新京报贝壳财经讯(记者罗亦丹)2月10日,腾讯混元开源面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,该模型基于1.8B参数的小尺寸模型,通过2Bit量化技术,等效参数量约为0.3B,实际存储占用仅约600MB,比常用的一些手机应用还小,实现了端侧部署的新突破。

该模型基于混元团队首创的产业级2Bit端侧量化方案,通过对HY-1.8B-Instruct模型进行2比特量化感知训练(QAT)产出,模型大小减少至原始精度模型的1/6,同时在真实端侧设备上生成速度提升2-3倍,可大幅提升使用体验。能力上,模型还保留了原版的思维链,可以为不同复杂度的任务提供相应深度的推理过程。这是业界首个实现2bit产业级量化的端侧模型实践。

随着大语言模型普及,如何将模型在手机、耳机或智能家居等设备上应用,成为业界难题,尤其是不少应用对模型的离线部署、私密性等都有更高的需求,这就需要更多能够在端侧运行的又小又强的模型。目前,模型已在开源模型社区Huggingface和Github上线。

编辑 杨娟娟

校对 柳宝庆

责任编辑:诳时惑众网

媒体矩阵


  • 客户端

  • 微信号

  • 微博号

  • 抖音号

客户端

亿万职工的网上家园

马上体验

关于我们|版权声明| 违法和不良信息举报电话:010-84151598 | 网络敲诈和有偿删帖举报电话:010-84151598
Copyright © 2008-2024 by {当前域名}. all rights reserved

扫码关注

诳时惑众网微信


诳时惑众网微博


诳时惑众网抖音


工人日报
客户端
×
分享到微信朋友圈×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。