AMD推出MI350系列AI芯片

AMD推出MI350系列AI芯片

AMD在加州圣何塞举办的“Advancing AI 2025”大会上正式推出Instinct MI350系列AI加速器,包含MI350X(风冷)与MI355X(液冷)两款型号。这款基于CDNA 4架构的芯片采用台积电3nm工艺,集成1850亿晶体管,配备288GB HBM3E内存,带宽达8TB/s,其技术规格与市场定位均展现出AMD在AI芯片领域的强劲攻势。

MI350系列的核心突破在于支持FP4/FP6低精度计算。在FP4精度下,单卡峰值算力达20PFLOPS,8卡并联系统更可实现2.57EFLOPS的算力输出。这一设计使MI350X在运行Llama 3.1 405B模型时,推理性能较前代MI300X提升35倍,DeepSeek R1模型的推理速度也达到3倍提升。MI355X作为旗舰型号,功耗达1400W,搭配液冷系统,针对高密度计算环境优化,其FP64性能较竞品接近翻倍。

在内存配置上,MI350系列同样表现出色。288GB HBM3E内存容量为NVIDIA B200的1.6倍,配合8TB/s的带宽,可支持单GPU运行5200亿参数的大型模型。在DeepSeek-R1任务中,MI355X每秒生成的tokens比B200多20%-30%,且每美元算力成本效益高出40%。

市场定位方面,MI350系列瞄准AI训练与推理两大核心场景。在训练场景中,其大带宽与GPU间互联性能可高效处理千亿级参数模型;在推理场景中,FP4/FP6低精度计算显著降低功耗与部署成本。AMD通过“基于价值的销售”模式,强调系统总效能与成本的均衡,而非单纯追求峰值性能。例如,MI350系列兼容NVIDIA HGX平台,支持64-128颗GPU横向扩展,可构建36TB共享显存池,满足超大规模集群需求。

为增强生态竞争力,AMD同步推出ROCm 7软件栈,集成VLM、SGLang等开源框架,支持180万+Hugging Face模型。此外,AMD还展示了端到端开放式机柜级AI基础设施,集成MI350系列加速器、第五代EPYC处理器及Pensando Pollara网卡,该方案已在Oracle Cloud Infrastructure部署,2025年下半年全面上市。

客户反馈与行业反响亦验证了MI350系列的市场潜力。微软、Meta、xAI等企业已表达合作意向,OpenAI CEO奥特曼更现身发布会,透露参与MI400系列联合研发。尽管面临NVIDIA在软件生态(如CUDA)的竞争压力,AMD通过性价比优势与开放策略,正逐步赢得市场份额。例如,MI355X每美元可生成tokens量较B200多40%,这一数据对成本敏感型客户极具吸引力。

AMD计划于2026年推出MI400系列,由AMD与OpenAI联合研发,采用HBM4内存(432GB,带宽19.6TB/s),FP4算力达40PFLOPS。配套Helios机架可集成72颗GPU,算力达2.9EFLOPs,进一步强化AMD在超大规模AI训练领域的布局。

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值的内容,就在 32度域 扎堆
(0)
上一篇 2025年6月19日 15:27
下一篇 2025年6月20日 21:12

猜你喜欢

  • 芯片及半导体

    台积电拿下Tensor G5代工权,三星深夜上演“反思大会”

    ​“失去一个客户只需一次良率失控,赢回信任却要十年如一日。”​三星电子会议室里,高管们面对谷歌转投台积电的五年合约,终于读懂了半导体行业的残酷法则。


    ​合作破裂:一场早有预兆的“分手”​

    谷歌与三星的芯片代工姻缘始于2021年Tensor G1芯片,此后四年间,从Pixel 6到Pixel 9系列,三星始终是谷歌自研芯片的独家代工厂。
    这份紧密合作曾被视为“双赢典范”——谷歌借三星产能实现芯片自主,三星则用大订单填满晶圆厂。
    裂痕出现在3纳米工艺量产的关键时刻。当三星的3nm GAA(全环绕栅极)技术因​​良率长期徘徊在30%-40%​​ 而举步维艰时,台积电的N3E工艺却以​​超过60%的良率​​实现稳定交付。
    谷歌用脚投票,将Tensor G5到G9的代工权打包交给了台积电,合约横跨Pixel 10至Pixel 14系列,彻底关闭三星直到2030年的回归之门。


    生死良率:压垮三星的最后一根“纳米”​

    “芯片代工行业,​​良率就是信仰​​。”一位业内人士如此总结。三星3nm工艺的理论参数堪称华丽:相比4nm芯片功耗降低45%、能效提升34%,但实验室数据终究敌不过量产现实。
    ​良率不足的连锁反应​​像多米诺骨牌般击穿生产链:成本飙升导致报价竞争力丧失,交期延误打乱谷歌新机发布节奏,芯片稳定性问题更让Pixel手机饱受“发热续航差”诟病。
    反观台积电,其N3E工艺已在苹果A17 Pro和高通骁龙8 Gen 3上验证成熟,让谷歌吃下定心丸。就连三星自己的Exynos 2500也因良率崩盘,导致Galaxy S25全系改用高通芯片——这场面在三星历史上堪称黑色幽默。


    技术对决:Tensor G5的台积电基因​

    搭载于Pixel 10系列的Tensor G5,正成为谷歌技术野心的新载体。基于台积电N3E工艺的芯片采用​​“1+5+2”三簇架构​​:单颗Cortex-X4超大核飙至3.9GHz​​(手机芯片罕见高频),五颗A725中核兼顾性能与能效​​,​​两颗A520小核专司低功耗任务​​。GPU则搭载Imagination的DXT-48-1536单元,AI模块沿用谷歌自研TPU。
    更微妙的是,​​谷歌给三星留了“安慰奖”​​——Pixel 10仍采用三星Exynos 5400基带。这款4nm基带支持1024 QAM调制技术,FR1频段带宽达380MHz,理论速率突破11.2Gbps。但基带订单的甜头,终究难掩失去主芯片代工的苦涩。


    三星急救:2nm豪赌与信任重建​

    失去谷歌订单后,三星DS(设备解决方案)事业部火速召开全球战略会议,将​​3nm良率突破50%​​ 定为近期生死线。
    更押注2nm工艺翻身,目前试产良率约40%,力争下半年量产时达70%经济线。但台积电的2nm良率已领先20个百分点,且获得英伟达、苹果等头部客户背书。
    市场分析师指出,即便三星技术追平台积电,​​信誉修复才是最大障碍​​:“客户可能要求双重代工分散风险,就像高通同时下单台积电和三星那样”。而谷歌的五年长约,恰给三星留下技术攻坚与重建信任的窗口期。


    行业洗牌:代工战场没有“备用选项”​

    谷歌的转向折射出半导体制造业的深层变革。当芯片制程进入纳米级竞赛,​​“稳定交付”正超越“技术参数”成为客户首选​​。
    台积电凭此独占全球75%代工份额,而三星尽管握有最先进GAA晶体管技术,量产能力短板却让其沦为“备胎”。
    中芯国际、华虹等中国厂商的崛起同样警示:在动辄千亿投资的晶圆行业,​​一次良率事故足以让客户集体倒戈​​,而信任崩塌的速度永远快于技术追赶。


    当三星展示2nm原型芯片时,台积电的工程师们正为谷歌Tensor G5量产的晶圆签名确认——​​后者承载的不仅是纳米线宽,更是五年合约的重量​​。
    半导体战争的胜负,从不取决于纸面参数的华丽程度,而在于流水线上千万次重复的精度。
    ​那里没有奇迹,只有良率的百分比;没有速胜,只有信任的复利。​
    对三星而言,这场“深度反思”或许来得太迟,但对整个行业而言,谷歌的转身写下一则冰冷启示:在芯片代工的世界里,​​实验室是天才的舞台,但量产线才是强者的战场。​

    本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
    如对本稿件有异议或投诉,请联系 lin@sentgon.com
    👍喜欢有价值的内容,就在 32度域 扎堆
    2025年6月21日
    000

发表回复

登录后才能评论