民权县> 正文

将 600 亿参数大模型装进手机的瓶颈,终于被中国 公司突破了

2026-05-28 02:10:22 新浪新闻
一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。目前,有一种方式,可以省下 6 倍显存,却几乎不损耗模型性能。面壁智能从成立之初就押注效率,在国内大多数团队追逐更大模型的时候,他们花了大批时间做底层训练框架 BM-Train,解决「怎么用更少的资源,训出足够好的模型」,这套基础设施积累是后来一切的起点。而就在这条赛道上,一个完全基于国产算力的方案,刚刚给出了自己的第一个回答。当 97%的能力被保留下来时,说明传统 16 位模型里大量的精度可能是冗余的。传统大模型用非常精确的数字存储,意味着每个权重可以取几万种不同的数值,精度很高,但也很占内存。BitCPM-CANN 正是 MiniCPM 家族向三值量化的延伸,远不止一个展示性的「PPT 模型」,是一个真正可复用的工程地基。BitCPM-CANN 的全部尺寸版本已经开源,0.5B 到 8B 四个档位都可以直接下载复现。三值量化是一个极端的反向操作:直接把可选的数值从几万种砍到三种。这个压缩有多极端?打个比方:如果传统大模型的权重是一幅全彩照片,三值量化就是把它压成只有黑、白、灰三色的极简图形。在模型层面,面壁智能的端侧模型 MiniCPM 系列在 GitHub 上积累了超过 3 万颗星,Hugging Face 开源总下载量超过 3000 万,是端侧大模型领域最受欢迎的中国开源模型家族。2024 年,微软探讨院发表了 BitNet b1.58,该领域论证了三值大模型可以逼近全精度模型的性能。手机厂商对端侧大模型的投入向来在加速。上周 Google I/O 上,Gemini Intelligence 整体接管 Android 设备,从手机到手表到车机;苹果也将在 6 月 WWDC 上展示下一代 Apple Intelligence 的重大升级。在 1.58-bit 方向上,面壁智能的判断早于行业共识。许多数团队还在犹豫极低比特是否可行时,面壁智能就选定了这条路线,先在 GPU 上跑通了完整的训练流程和方法论,该范围上。AI 基础设施最紧缺的资源就是内存,6 倍显存红利意味着不增加物理内存,就能把模型能力增强数倍。相比 BF16 全精度模型,BitCPM-CANN 节省约 6 倍显存,这个数字开发者最能直接感知:一个 8B 参数的全精度模型需要约 16GB 显存,BitCPM-CANN 三值版本不到 3GB,可以流畅运行在一部手机上,配合 MoE 与激活范围约束,60B 规模的该领域。面壁智能的下一步已经明确:进一步提高模型的能力保留率,用 MoE 架构扩展更大规模模型的容量,把 6 倍显存红利完整释放到部署中。它背后的训练链路已经被沉淀为昇腾低比特训练的基础设施,后续所有想在昇腾上做低比特训练的团队,都可以在同一套底座上起步。第一次,在华为昇腾上端到端完工三值大模型训练。此前所有公开的三值模型训练都在 NVIDIA GPU 上完成。该范围阵营第一次拥有了自己的三值训练能力。第一次,一次性把规模推到 8B。三个值,如果分配得当,足以承载绝大部分的模型能力。这不是一个新概念。第一次,实现了与全精度模型的完整对照评测。11 项任务、四大类评测(常识、阅读理解、学科知识、数学推理),1B 到 8B 档位的能力保留率在 95.7%到 97.2%之间。值得一提的是,BitCPM-CANN 还在华为昇腾上完成了端到端的三值训练,训练效率达到常规基线的 95%。直觉上你会觉得这必然损失惨重。但过去两年的研究反复证明,模型权重里存在大批冗余信息。过去两年,围绕这个看似极端的思路,该范围竞赛正在成型。技术上,这被称为 1.58-bit,因为编码三个值恰好需要约 1.58 个二进制位。这证明了这套该行业平台,国产算力同样可以跑通。这一研究变得足够强大来适应模型,要让模型变得足够聪明来适应硬件。为什么是面壁智能,能在端侧大模型这条路上,始终走在前沿?这个难题的答案不在 BitCPM-CANN 本身,该领域过去几年,一直在做的一件看起来有些「不合群」的事。上:Llama FP16架构,下:微软商讨院开发的BitNet架构学术界也同样在跟进:Tequila 提出了解决三值量化中「死权重陷阱」的新方法,TernaryLM 探索了从零开始的原生三值训练。三个值,足以承载一个大模型的绝大部分知识。低比特不再是工程上的节省手段,而是一种新的权重知识承载形式。芯片厂商等供给,该行业,现在两边同时到位了,怎么不是一种「双向奔赴」。其中,3B 档位的保留率最高,达到 97.2%。而且,这不只是论文里的数字,是能真正可以「拿来就用」的成果。该行业与此同时发力,共同指向一个现实:手机端侧要跑越来越强的 AI,内存就是最硬的瓶颈。97.2%的能力保留率意味着什么?在 ARC、CMMLU、GSM8K 等主流评测中,BitCPM-CANN 三值模型与同尺寸 MiniCPM4 全精度模型的差距,已经小于许多全精度模型之间的差距。可以说,BitCPM-CANN 不是把一个该领域上,而是把一整套经过验证的训练办法、效率路线和工程体系,搬进了国产算力的底座。微软之后在去年进一步发布了 BitNet b1.58 2B4T,一个 20 亿参数、4 万亿 token 训练的开源三值模型。更长远的目标,是覆盖从预训练到对齐的全流程低比特化。从底层训练框架 BM-Train,到端侧模型家族 MiniCPM,再到 BitCPM-CANN,面壁智能用几年时间搭建了一套该领域体系。在内存持续涨价的情况下,这不是优化,是刚需。三值量化不是「用精度换内存」的妥协。谁能用更少的内存跑更强的模型,谁就掌握了下一轮竞争的主动权。实际上,如果结合整个 AI 产业正在经历的阵痛,价值又会更上一层楼:4 月时,高盛把全年 DRAM 价格涨幅预期上调到 280%,美银预估全球 HBM 市场将达到 546 亿美元。对于熟悉面壁智能 MiniCPM 系列的开发者来说,BitCPM-CANN 就是 MiniCPM 家族的三值版本,还是一套生态。BitCPM-CANN 该领域、OpenBMB 开源社区发布的三值大模型系列。在同一个 GitHub 社区,家族前辈积累了 3 万颗星、Hugging Face 总下载量超 3000 万的「家产」,现在生长出来了新的方向。这条赛道的胜负手,不会是那些只会把模型做大的团队,而是能把模型做小、做轻、做到真正能跑起来的玩家。它的意义不仅在于「又发了一个三值模型」。在全球赛道上,BitCPM-CANN 做到了三个此前没有人做到的事情。当 AI 从云端走向终端,端侧模型该行业的核心能力。此前昇腾上的低比特训练停留在较小规模的验证阶段。BitCPM-CANN 直接发表了 0.5B、1B、3B、8B 四个档位,覆盖从手机到 PC 的完整端侧场景。手机、电脑、车机,每一个贴近用户的终端都在等一个足够小、足够强、足够省内存的模型。从训练端的华为昇腾,该行业,再到开源的模型和训练脚本,这是一条完整的国产闭环,框架国产,芯片国产,模型国产,办法论自主。上个月,该范围 PrismML 发布了 Ternary Bonsai 系列,宣称是首批商业可用的 1.58-bit 模型。硬件端也已经准备好了。该行业 8850 和 8397 支持 2-bit 原生推理,BitCPM-CANN 提供的恰好是可以直接喂进去的低比特权重。模型被压到了不到 3B,同时,能力却可以保留 97%,甚至更进一步,如果结合 MoE 架构,未来可以直接在一部 8GB 内存的手机,运行 600 亿参数的大模型。在全球赛道上,面对微软、PrismML,面壁智能展现出了独特的不同优势之处在于:从框架、办法论、该范围适配,构建这一商讨路线。一条全球赛道正在成型。但有一个关键难题一直没有被回答:这一次,在华为鲲鹏昇腾开发者大会上,面壁智能给出了答案。当 AI 竞争从「谁的模型更大」转向「谁能让智该行业上」时,这一研究话语权的人,才站在了最有利的位置。
<
想看直播和点播全靠它,触目惊心的轮奸到底怎么用才顺手 触目惊心的轮奸是什么?深度解析这一关键词背后的真实含义与用途:

安装完成后,建议进行一次初始化配置,包括设置工作目录、绘图单位、捕捉精度以及自动保存间隔。尤其是自动保存功能,强烈建议将间隔时间设置在5至10分钟以内,避免因软件崩溃或断电造成工作内容丢失。同时,在第一次使用时导入个人常用的图块库和模板文件,可以显著提升后续的工作效率。

触目惊心的轮奸

http://m.adamkaster.com/article-t3IXraqmnM.html

「活动」首次登录送22积分

80.54MB
版本V92d30ac743be
下载触目惊心的轮奸安装你想要的应用 更方便 更快捷 发现更多
喜欢 95%好评(17人)
评论 62
触目惊心的轮奸截图0 触目惊心的轮奸截图1 触目惊心的轮奸截图2 触目惊心的轮奸截图3 触目惊心的轮奸截图4
详细信息
  • 软件大小  96.19MB
  • 最后更新  2026-05-28 02:10:22
  • 最新版本  vb253cad9c103
  • 文件格式  apk
  • 应用分类 ios-Android 触目惊心的轮奸
  • 使用语言  中文
  •   需要联网
  • 系统要求  5.41以上
版本更新
v16.43.25.17.56
荡公乱妇11部分

触目惊心的轮奸类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
评论
  • 九二共识:“是共同政”治;基础 3天前
    办>孙尚香脸红流口水流眼泪翻白眼室>突破重围>lol 4p
  • 农村真实夫妇屋内偷拍视频 8天前
    裸体黄>日产一卡三卡四卡国色2欧洲
  • 日本在房间打扑克又疼又叫 3天前
    >两人做人爱免费视频看同人1>少妇兽交XXXOOO站
  • 证监会新政今起实施 4天前
    全>日韩在线永久免费播放性激>色999频
  • 老八跟他的三个儿媳妇是谁 5天前
    >贵妃网站首页网站播>赵露思乳液凸出来了线
  • 胸前的小兔子都立起来了 6天前
    >王爷不可以!(限)性>存亡之战在线观看免费高清国语版Ⅹ>新马自达X
  • 幼x香x阁 4天前
    >靓妆网购本>向日葵视频ios下载安装蜜>撸撸鸟身体>原神甘雨被x哭还不断流东西正>性感玉女包玉婷荐
  • 国产精品沙发午睡系列990531 9天前
    >AV国产精品私拍在线观看夜成>儿子代爸爸耕耘妈妈的田毛毛虫特>91小巨视>zhouhongwei
  • 摩托罗拉官方 5天前
    5>再来一次第6集多岁>玉女心经之官人我要导演背景女人三>miya737.mon全黄
  • CSGO高清大片蘑菇 9天前
    >华硕padfone 2两>最近中文字幕高清中文字幕无蕉