PG·电子(中国文化有限公司)- 数字纹身技术领航者

『行业资讯』提供数字纹身行业最新动态,包含PG电子技术突破、市场数据及行业趋势,年发布专业资讯120+篇。

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

2025-09-23  

  

DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥

  国产芯片企业股价也跟风上涨,比如寒武纪今日早盘盘中大涨近14%,总市值跃居科创板头名。

  半导体ETF,同样也是在半天的时间里大涨5.89%。(不知道作为放出消息的DeepSeek背后公司幻方量化,有没有趁机炒一波【手动狗头】)

  “UE8M0 FP8”这个概念,可以拆分成前后两个部分来解释,前面的UE8M0,是MXFP8路径里的“缩放因子”。

  Open Compute Project是2011年由Facebook(现Meta)联合英特尔、Rackspace等发起的开源硬件协作计划,目的是通过共享数据中心及服务器设计推动行业效率提升。

  其成员阵容相当强大,国外还有微软、谷歌、亚马逊、AMD、英伟达等,而国内的阿里、腾讯、百度等也参与其中。

  说回MXFP8,它以FP8为基础建立,FP8是把常规浮点格式压缩到8 bit的一种编码方式。

  MXFP8的核心思想是先把张量切成固定长度的“块”,然后为每个块单独指定一个2的整数次幂作为“缩放因子”,把块内所有数一起除以这个系数后再写成FP8。

  这种块级(而不是全张量级)的缩放,让MXFP8既保留了8 bit位宽,又把可用动态范围扩展了几十倍。

  而这里的“缩放因子”也是包含8个bit,其中包含符号位、指数位和尾数位,开发者可以自行将这8个bit分配给这三种不同的位。

  其中符号位只区分有无,若有则占一个bit,无则不占用,而UE8M0中的U表示的就是无符号(有符号可表示为S或省略不写)。

  E和M则分别表示指数位和尾数位分配到的bit数,E8M0指的就是8个bit全都分配给了指数位。

  其他常用的格式还有E4M3、E5M2(缩放引子外的本体部分也常采用这两种)等,它们PG电子官方平台均包含符号位,其余7个bit在指数和尾数位之间分配。

  首先,由于UE8M0不含尾数与符号位,处理器在根据缩放因子对数据进行复原时,只需要乘以对应的2的幂,也就是移动一下指数位,而不需要浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。

  并且UE8M0的动态范围覆盖2^(−127)到2^128,其指数表可轻松容纳这一跨度,为后续块缩放提供充足空间。

  另外UE8M0还能解决单尺度FP8无法同时顾及大/小值,导致溢出或被压成0的问题,将UE8M0作为分块的尺度后,错误率曲线从整张曲线下降到一条远低水平的横线 bit张量精度的同时大幅减少信息损失。

  UE8M0 FP8的好处我们了解了,现在可以解释为什么它更适配“下一代国产芯片”了。

  大部分已量产的国产AI加速器仍沿用FP16/BF16 + INT8的计算通路,并未集成E4M3/E5M2这类完整的FP8乘加单元。

  不过,摩尔线首发的新款国产芯片已经在宣传资料里列出“原生 FP8”或“Block FP8”支持,并与 DeepSeek、华为等15家厂商联合验证UE8M0格式。

  虽然下一代国产芯片虽然已经在为FP8做出准备,但HBM/LPPDDR带宽仍然与顶尖芯片存在较大差距。

  而UE8M0让一组32个FP8数据只追加8bit缩放引子,相比传统的4B(32bit) FP32缩放直接节省75%的流量,这种空间节约措施被视作下一代架构的重要优化方向。

  在官方有意卖关子的情况下,人们只好首先把目光放在了首批通过“DeepSeek大模型适配”的8家厂商。

  截至今日10:25,寒武纪盘中大涨近14%,总市值超4940亿元,超过中芯国际跃居科创板头名(实际以最新为准)。

  理由也很简单,该公司旗下的MLU370-S4、思元590及最新690系列芯片均支持FP8计算,在架构设计和低精度计算优化上一直相对比较领先。

  而基于类似理由,海光、沐曦,中昊芯英甚至包括名单之外的摩尔线程等也都被网友们挨个点名:

  与此同时,一些很有可能“即将上车FP8”的厂商也出现在了一众盘点名单中。

  例如华为昇腾,虽然昇腾910B和910C暂不支持原生FP8,但官方路线”,所以众人预计或将在2026年推出的910D(可能的命名)很有可能是所谓的“下一代芯片”。

  虽然猜来猜去没有最终定论,但不妨碍市场给予热烈回应。根据最新消息,今日国产芯片概念集体高开,科创50大涨3%创近三年半新高,芯片产业链集体走强。

  所以,大家为什么集体狂欢?这些国产芯片一旦支持UE8M0 FP8究竟意味着什么?

  这里头的逻辑也很简单清晰,正是由于UE8M0 FP8精度格式所具备的上述优势(更小的带宽、更低的功耗、更高的吞吐),这意味着同样的硬件今后能跑更大的模型,所以国产芯片的“性价比”被大幅拉高了。

  从另一方面来看,DeepSeek通过改动精度格式,相当于主动贴合国产芯片的最佳性能点,这种软硬协同的模式无疑是把国产芯片们拉进了一个统一的生态坐标系。

  这就像当年的“Wintel联盟”一样——微软和英特尔通过深度技术绑定,筑起了个人计算机领域的生态护城河,只不过如今换成了DeepSeek和国产芯片厂商们。

  所以你说它这个动作吧,不知道算无意还是刻意为之,总之是相当微妙了(手动狗头)。

  特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。

  DeepSeek预测:到2030年,300万的房子还值多少钱?答案终于揭晓

  重磅!英伟达1000亿美元投资OpenAI,奥特曼爆买500万块GPU

  科股早知道:GPU龙头摩尔线程科创板IPO将于周五上会,国产AI芯片厂商呈现加速渗透态势

  黄仁勋:中国的AI市场无论有没有英伟达都会进步 与华为是竞争对手不是敌人

上一篇:华硕X870B850主板美学新势力 实力畅玩《泰坦之旅2
上一篇:抢在GPT-5前升级模型Anthropic发布Opus 41

猜你喜欢

  • 顶风违规吃喝!中央层面通报典型问题有何深意?

    顶风违规吃喝!中央层面通报典型问题有何深意?

      日前,中央层面深入贯彻中央八项规定精神学习教育工作专班、中央纪委办公厅公开通报2起党员干部在学习教育期间违规吃喝、严重违反中央八项规定精神。通报指出,2起违规吃喝问题均发生在学习教育期间,组织者和参与者主要是党员领导干部,是典型的目无法纪、顶风违纪,性质极为严重,影响极为恶劣,教训极为惨痛。这次学习教育把集...
  • 国产精品自产拍在线播放

    国产精品自产拍在线播放

      据介绍,全省夏收工作6月7日基本结束,夏粮丰收已成定局。夏播工作从5月28日大面积展开,截至6月13日,已播PG电子官方网站种面积7915.2万亩,夏播工作大头落地。初步统计,目前全省因旱不能播种面积323万亩,若未来持续无有效降水,夏播进度将会进一步放慢。   近些年我们也能看到这些举措,中...
  • 大司命死亡执政官皮肤值得入手吗?深度对比与建议!

    大司命死亡执政官皮肤值得入手吗?深度对比与建议!

         大家好,我是游戏晓弟,今天我们来聊聊王者荣耀最近的重磅消息:大司命的死亡执政官皮肤!这款皮肤在与《诡秘之主》的联动中正式上线,吸引了众多玩家的关注与讨论。很多人可能还在犹豫是否要入手这款皮肤,今天晓弟就为大家做一个全面的对比与分析,帮助大家做出明智...
  • ChatGPT重磅升级GPT-41:编程专家模型登场

    ChatGPT重磅升级GPT-41:编程专家模型登场

      OpenAI在X平台正式官宣ChatGPT迎来重大升级,新一代GPT-4.1模型PG电子官方平台全面上线。   此次更新采用差异化推送策略:付费订阅用户(Plus/Pro/Team)优先体验完整版GPT-4.1,而所有用户均可使用轻量级GPT-4.1 mini,旧版GPT-4.0 mini同步退出历史...

手机扫一扫添加微信