麻辣社区-四川第一网络社区

校外培训 高考 中考 择校 房产税 贸易战
阅读: 1980|评论: 4

[转帖] 美解禁H20说明中国芯片水平

[复制链接]

发表于 2025-7-30 09:17 | 显示全部楼层 |阅读模式
7月15日,美国财政部长贝森特在彭博电视台节目中说,中国已经研发出性能与H20相当的芯片,因此英伟达销售H20芯片不存在问题。这是美国政府首次公开承认,中国在同类AI芯片上已具备可替代能力。
更为直接的解释,是白宫“AI沙皇”大卫·萨克斯点出的。2024年12月5日,特朗普宣布萨克斯将任新设的“白宫人工智能与加密货币事务专员”。今年7月16日,萨克斯对彭博社表示,恢复向中国大陆销售英伟达H20芯片并非“让步”,而是一种精准遏制华为的手段。萨克斯说:
“有充分理由这么做:你不希望把整个中国市场拱手让给华为。即使是一颗性能被削弱的芯片,英伟达也能在中国拿下很大一块份额,从而挤压华为的空间。”
美国对H20解禁,政治相关的活动不难看到,但并非关键。贝森特与萨克斯所指的GPU技术与市场背景,是说服特朗普的关键,需要仔细解释。
国产GPU市场与技术进展
国外机构对华为昇腾GPU营收的估计,根据国内先进芯片产能估算,910B、910C和910X是性能逐步提升的昇腾GPU型号。产能单位“kwpm”意为“千片晶圆每月”,而“Die per wafer”是指每片晶圆上的“裸芯片”数量,单个芯片面积越大数值越小,可以看出910C和910X面积约是910B两倍,而910B一片12寸晶圆(直径300毫米,面积约700平方厘米)也只有78颗,说明GPU芯片面积是比较大的。
“yield rate”是指良率,由于7nm先进芯片用DUV光刻机需要复杂的多重曝光工艺,外媒估计良率起步只有15%,逐步提升至50%,最高70%。910B、910C、910X的初始价格根据市场信息估为5万、11万、14万,供应上来后会有降价。
这个估算很粗略,但结果极为惊人。2024年华为GPU芯片营收为429.47亿人民币,2025年预计大增240%至1461.07亿,2026年再增45%至2120.23亿,2027年2865.67亿。2024年华为营收为8621亿,净利润626亿。如果利润率极高的GPU能再有2000多亿营收,这将极大支撑华为的研发能力扩增。这个估算肯定不准确,但能够说明中国算力GPU市场的规模与利润。
在5月21日的台北国际电脑展新闻发布会上,黄仁勋说“英伟达在中国的市场份额从95%跌到了50%”。其实2024 年,中国市场只占英伟达全球营收12.5%,对应金额约170亿美元,并不算特别多,因为比H20更先进的GPU不能卖。虽然中国市场销售受限,但并未影响英伟达全球营收飞速扩增。不过黄仁勋担心的是,2025年之后中国算力GPU市场会有较大增长,英伟达让出的市场份额会成为中国竞争对手的“成长加速器”。
让外界震惊的是,在技术如此复杂的算力GPU领域,中国遭美国最高程度限制打压,却初步发展出能与英伟达竞争的软硬件系统能力。近期出来的标志性成果,是华为基于昇腾910C打造的CloudMatrix 384超节点,性能直接对标英伟达GB200 NVL72系统
2025年4月16日,半导体与人工智能分析机构SemiAnalysis出报告详细分析华为CloudMatrix和910C。从中可以看出,虽然中国先进芯片制造技术受限,但用综合解决方案追平GPU芯片的性能差距。让众多西方公司难以追上英伟达的复杂技术问题,却是中国公司的机会,复杂反而提供多条路线优化的可能性。
华为用384颗910C组成的CloudMatrix 384超节点 (以下简称CM384),BF16算力高达300 PFLOPS(PFLOPS等于1000TFLOPS),约为GB200 NVL72的180 PFLOPS的1.7倍。明显的代价是,系统功耗约为NVL72的4.1倍,每TFLOPS功耗是2.5倍。也需要3.6倍的总内存容量,以及2.1倍的Scale Up Bandwidth总带宽。
在物理尺寸上,CM384就明显比GB200 NVL72机柜要大得多。它有16个机架,12个做计算,4个用于数据交换,简单目测就是NVL72机柜约16倍大小与占地面积。需要用五倍的芯片数量,10倍以上的体积与占地面积,来弥补单个芯片性能的差距。
但总算力赶超就是很大的成就,为此CM384架构上需要一些“大招”。有趣的是,只要想出办法,7nm与3nm芯片性能的差距,在整个GPU算力系统中就不算很关键了。例如华为擅长的数据通信领域技术,“光互联”就起到重要作用。
SemiAnalysis认为华为的工程优势在于系统层面,而不仅仅是芯片层面,还有拓扑网络、光互联技术和软件堆栈的创新。
H20解禁的意义
笔者曾参观过H20服务器生产线,主要成本是一个8×H20的盒子(英伟达销售的时候就是8卡一起),还有主板、CPU、NVLink互联及4×400 GbE网卡等等,组装成一个完整的服务器。它的总算力是BF16 1184 TFLOPS,不比一个910C的理论算力高多少,不适合用于基座大模型训练。
H20在中国需求不错,一个重要原因是DeepSeek带动推理服务器部署需求,以及垂类模型训练需求。H20单卡价格在10万元左右,八卡服务器的价格在110万元至130万元之间,利润很高。中国大模型研发应用还是更习惯CUDA生态,H20组的推理应用较为成熟。
H20的特性是,算力不到H100的十分之一,但是HBM容量有96GB、141GB,HBM带宽4.0TB/s,这都和H100接近。大模型推理应用时,矩阵计算远不如训练时密集,数据在GPU之间的传输多,H20的数据传输表现不错。几家头部互联网公司下了不少订单,2024年就预订了160亿美元的H20。
H20的性能指标不算太强,国产GPU完全有能力接近它。除华为昇腾,还有摩尔线程、壁仞科技、沐曦、天数智芯等多家在做算力GPU。这几家GPU头部企业已全部启动IPO或借壳程序,在科创板、港交所同步推进,上市节奏明显加快。拿出性能不错的GPU产品的其它公司还有多家。
由于美国制裁的影响,中国企业即使觉得英伟达CUDA生态好用,也还是在努力探索其它平台
科大讯飞星飞大模型与华为联手,坚持软硬件全栈自主的技术路线。星火大模型训练与推理全部跑在华为910B/910C全国产万卡集群“飞星一号”上;二期 “飞星二号”预计2025年内交付,可支撑万亿参数模型持续训练。
星火大模型研发团队由于技术路线特殊,适配需要花费极大精力,华为也要派很多人一起维护开发GPU运行,非常艰苦。经过几年努力,目前星火大模型性能已经追赶上来,多种垂类模型与中石油、中海油等大国企应用合作,有特殊的战略价值,生态会不断壮大。
上市公司寒武纪的MLU(Machine Learning Unit)云端智能芯片,其实就是GPU,目前取得仅次于昇腾系列的应用成绩。寒武纪思元590能支撑DeepSeek-R1 671B、Llama-3、Qwen-3等主流开源大模型的千卡级训练,实测算力密度达到 A100的80%。思元690传有中芯国际预留先进芯片产能。寒武纪的“硬件-软件-生态”体系已经初步成型,与国内主流大模型开发商合作,目标是2025-2026年形成训练推理全覆盖的国产算力矩阵。技术前景支撑了寒武纪2800亿的市值,维持了超过半年,并非一般快速见顶的题材炒作,2025年一季度转为盈利。
近期,国产大模型开发势头很好。DeepSeek在2025年初突破以后,开源几项关键技术,推动行业大发展。目前阿里Qwen系列、Kimi K2等国产大模型在开源榜单上成绩很好,引发全球关注。字节、腾讯等大企业对大模型也有很高投入,应用场景丰富,实力迅速增长。
国产AI软硬件生态与半年前相比,都可以说完全两样了,实力暴涨,各类突破层出不穷。生态有了,技术信心也起来了,对于美国AI封禁并没有那么在乎了。
这一切,是以前完全不敢想的,大发展的动力绝对是美国芯片制裁。芯片业国产替代、生态建设已经进入繁荣期。而GPU由于技术复杂,应用场景多,能想的系统级办法也多,对于EUV光刻机的依赖并不严重,因此CM384可以追上NVL72的总算力。多家国产GPU各有绝活,又是IT互联网公司资本投入的重点有真金白银,属于较为活跃的芯片创新领域。
美国的制裁现在很微妙,全球业界其实也已有判断,愿意与中国搞好关系。连美国政府自己都明白,中国已经熬过芯片制裁,国产GPU芯片的巨大市场需求都已出现。而国产大模型与美国差距显著缩小,几家公司都至少有技术跟随能力。从限制中国芯片与人工智能技术发展的角度来看,美国制裁已经失败了,中国取得了长足的进步,没法限制了。
2018年美国对中国发动贸易战以来,已经可以得出结论:美国科技制裁,对我国科技发展正面作用极大;芯片产业出现发展奇迹,连最尖端的GPU芯片都有了中国生态。
而H20的解禁,说明美国内部承认中国AI领域的软硬件自主发展成果,认识到了制裁的负面作用。美国方面已经调整目标,不再坚持彻底封杀中国的目标,而是改为“占领全球AI市场”。
这其实就是意识到,中国是竞争对手,市场需要去竞争。黄仁勋在中国、中东等地的商业活动,对美国政府的全球AI战略很有帮助,因此话语权上升,H20解禁也在情理之中。
美国政府的态度变化,说明中美芯片斗争已经进入新的阶段。美国政府愿意用稍微正常一点的市场逻辑来看问题了,不再一味封杀、愚蠢地让出宝贵市场,而是希望用H20来抢中国企业的市场份额。
至于H20解禁是否会损害国产芯片的市场前景,看了前面的技术分析就能明白,华为CloudMatrix 384这种能与英伟达最先进服务器对标的产品,远超H20的技术指标,不在一个层面竞争。H20能够补充中国的大模型推理算力、垂直模型训练算力,有利于大模型应用推广,解禁也不是坏事。
在更为广阔的AI训练与推理应用市场,国产GPU市场需求随着自主生态的逐渐完善,必然有高速增长。如果美国为了破坏中国市场生态,又解禁性能更强的GPU,那么中美科技斗争的胜负趋势就更为明显。


打赏

微信扫一扫,转发朋友圈

已有 0 人转发至微信朋友圈

   本贴仅代表作者观点,与麻辣社区立场无关。
   麻辣社区平台所有图文、视频,未经授权禁止转载。
   本贴仅代表作者观点,与麻辣社区立场无关。  麻辣社区平台所有图文、视频,未经授权禁止转载。

 楼主| 发表于 2025-8-2 08:58 | 显示全部楼层
华为宣布5纳米芯片量产

发表于 2025-8-2 23:41 | 显示全部楼层
         你还没搞懂嗦,中国已经发现卖给中国的的H20芯片全部都有后门,随时都可以关闭。

发表于 2025-8-3 09:09 | 显示全部楼层
美国芯片不可信

发表于 2025-8-3 10:16 | 显示全部楼层
H20芯片是英伟达专门为中国市场设计的“特供版”,性能只有米帝本土旗舰产品H100的15%到30%。
但就是这个产品,2025年占据了大国AI推理芯片市场93%的份额。
7​月31日,据“网信中国”消息,近日,英伟达算力芯片被曝出存在严重安全问题,国家互联网信息办公室就H20算力芯片漏洞后门安全风险约谈英伟达公司
华为昇腾910B芯片性能宣称已达H20的70%,而H20只有H100的15%~30%。也就是说,​华为昇腾910B只有H100性能的10%-20%。​字​节跳动、阿里、腾讯、百度四大巨头包揽80%的H20需求。而H20占据了大国AI推理芯片市场93%的份额。

高级模式 自动排版
您需要登录后才可以回帖 登录 | 注册

本版积分规则

复制链接 微信分享 快速回复 返回顶部 返回列表 关闭