四大国产GPU力挺DeepSeek!

四大国产GPU力挺DeepSeek!

蛇年前夕,AI 圈出了一个核弹级的消息:“国产AI之光”——deepseek 疯狂舞动刷屏,暴击美股,让整个硅谷坐立不安。DeepSeek 在1 月 20 日正式发布了一系列 DeepSeek-R1 模型,并上传 R1 系列的技术报告和各种信息。DeepSeek 此次共发布三组模型:

  • DeepSeek-R1-Zero:大规模使用强化学习(RL)技术,没有任何监督微调(SFT);
  • DeepSeek-R1:在强化学习前融入冷启动数据,多阶段训练;
  • DeepSeek-R1-Distill 系列:DeepSeek-R1 中蒸馏推理能力到小型密集模型,参数规模分别为 1.5B、7B、8B、14B、32B 和 70B。

而在1月27日,DeepSeek在苹果App Store美国区免费应用下载榜上超越ChatGPT,排名第一,在中国区排行榜上同样登顶。而且DeepSeek的员工规模约140人,还不及 OpenAI的1/10。国产AI大模型DeepSeek犹如春雷炸响,正在以前所未有的影响力轰动全球科技圈。当前沐曦天数智芯摩尔线程海光信息4家国产GPU企业,华为云腾讯云天翼云阿里云百度智能云火山引擎6家国内云计算巨头,无问芯穹硅基流动等AI基础设施企业,以及PPIO派欧云云轴科技、青云科技等独立云厂商,均已宣布适配及上架DeepSeek模型服务。还有更多企业正在跟上。DeepSeek也成为本季度科技财报电话会议的必问话题,在今日刚刚举行的财报电话会议上,AMD董事长兼CEO苏姿丰、谷歌CEO桑达尔·皮查伊都对DeepSeek大加夸赞。昨日,天数智芯、摩尔线程、海光信息接连宣布完成与DeepSeek模型的国产化适配。加上周日率先宣布的沐曦,已有4家国产GPU企业公开拥抱DeepSeek。上周英伟达AMD英特尔等海外芯片巨头更是早早完成支持。

四大国产GPU力挺DeepSeek!

▲近期官宣支持DeepSeek模型的芯片企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)在今日财报电话会议上,AMD董事长兼CEO苏姿丰称赞DeepSeek展现了“AI世界创新的速度和步伐”“模型和算法创新有利于AI普及”。她认为有新方法可以用更少的基础设施实现训练和推理能力,是好事,有助于在更广泛的应用领域部署AI计算,并夸开源模型的采用速度和步伐是相当惊人的。谷歌CEO桑达尔·皮查伊今日也在财报会议中夸DeepSeek是一支“了不起的团队”“做得非常非常好”。他透露说,谷歌的Gemini 2.0 Flash模型和2.0 Flash Thinking模型在效率方面与DeepSeek R1相当。随着AI推理成本不断下降,AI将有更多用途,皮查伊认为这是谷歌的“机会空间”。‍‍‍‍继两大海外云巨头AWS和微软Azure后,这两天更多国内云计算巨头加入到支持行列中。阿里云、百度智能云、火山引擎先后官宣对DeepSeek V3、R1模型的支持。加之此前的华为云天翼云腾讯云目前国内六大云巨头都已正式支持DeepSeek。

四大国产GPU力挺DeepSeek!

▲近期官宣支持DeepSeek模型的云服务及AI基础设施企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)DeepSeek卷起的全球AI风暴,正在深度卷入产业中的每一位玩家,而中国芯片圈和云服务领域的巨头和创企们,已然集体出动。

01.国内GPU企业纷纷响应,美国芯片三巨头到齐

国内外芯片厂商纷纷快速响应,宣布对于DeepSeek模型的支持。海外芯片三巨头中,AMD响应最积极,早在1月25日新年前就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平台发文中,AMD特别感谢了DeepSeek和SGLang团队的密切配合。

四大国产GPU力挺DeepSeek!

1月31日,AI计算“扛把子”英伟达也官宣其NVIDIA NIM微服务预览版对于DeepSeek-R1模型的支持。NIM微服务基于HGX H200系统,每秒能够处理3872个tokens。开发者们可以调用API进行测试和试验,该API后续会作为英伟达AI企业软件平台的一部分提供。

四大国产GPU力挺DeepSeek!

同样在1月31日,英特尔也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。国内芯片厂商这边,华为的昇腾系列AI芯片自然不必多说。沐曦也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。

四大国产GPU力挺DeepSeek!

▲沐曦模型资源包发布

DeepSeek-R1模型+沐曦曦云GPU+Gitee AI平台,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。官方称之为“100%国产AI的力量”。昨日,天数智芯、摩尔线程、海光信息接连宣布对DeepSeek模型的支持。天数智芯宣布与Gitee AI合作,仅用时一天,就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。

四大国产GPU力挺DeepSeek!

▲天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务

天数智芯写道,国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,能促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,有助于国内GPU拓展市场,完善产业链生态。摩尔线程已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。

四大国产GPU力挺DeepSeek!

▲摩尔线程官宣信息

摩尔线程称DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。海光信息也在昨日宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。今日,海光信息技术团队再次宣布成功完成DeepSeek-Janus-Pro多模态大模型与海光DCU的适配优化,并正式上线。这是海光团队近期完成适配优化的第三款DeepSeek大模型,充分展现了DCU强大的生态优势与技术能力。DCU是海光信息推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,即可基于DCU平台快速部署和使用相关模型。

02.中国六大云巨头均已支持DeepSeek

2月1日大年初四,华为云正式官宣,经过和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。

四大国产GPU力挺DeepSeek!

▲硅基流动联合华为云上线的DeepSeek-R1/V3推理服务

华为云提到得益于自研推理加速引擎加持,双方支持部署的DeepSeek模型可以获得持平全球高端GPU部署模型的效果。同日,天翼云宣布上架DeepSeek-R1模型。天翼云智算产品体系(息壤-科研助手、天翼AI云电脑、魔乐社区、“息壤”智算平台、GPU云主机/裸金属)均接入DeepSeek R1模型并上线相应服务。

月2日,腾讯云官宣了对DeepSeek-R1模型的支持,在腾讯云的HAI平台上,开发者大约花3分钟就可以接入并调用模型。

2月3日下午16点58分,阿里云官宣其PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。

44分钟后,百度智能云也宣布了其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,公布输入和输出价格,并从上线到2月18日24点模型限时免费。

昨日下午,字节跳动旗下火山引擎宣布将支持V3/R1等不同尺寸的DeepSeek开源模型,可以通过两种方式使用模型:一是在火山引擎机器学习平台veMLP中部署,二是在火山方舟中调用模型,将提供有竞争力的价格、全网最高限流、两周限时5折优惠,助力企业畅享满血版DeepSeek-R1。‍‍‍

同日,腾讯云TI平台宣布上架DeepSeek系列模型,包括“满血”的V3、R1原版模型和基于DeepSeek-R1蒸馏得到的系列模型,全面支持DeepSeek系列模型的一键部署,并限时开放了R1模型的免费在线体验。‍‍‍除了六大云巨头外,国内AI基础设施企业无问芯穹更是早在1月28日除夕一大早就宣布了其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。PPIO派欧、云轴科技则同在2月2日官宣对于DeepSeek模型的支持。PPIO派欧算力云支持了DeepSeek-V3、DeepSeek-R1、蒸馏模型DeepSeek-R1-Distill-Llama-70B,模型价格与官方价格保持一致。

云轴科技ZStack宣布AI Infra平台ZStack智塔支持企业私有化部署 DeepSeek V3/R1/Janus Pro三种模型,可基于海光、昇腾、英伟达、英特尔等国内外CPU/GPU适配。

海外市场,全球第一大云巨头AWS也在1月31日官宣DeepSeek-R1模型的全面上线。用户可在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart上部署DeepSeek-R1模型;在Amazon Bedrock上自定义导入DeepSeek-R1-Distill模型并在Amazon EC2 Trn1实例上部署DeepSeek-R1-Distill模型。

微软Azure云服务则是在1月30日宣布DeepSeek-R1正式上线微软的Azure AI Foundry以及GitHub。微软还贴心地给出了使用教程视频。

虽然DeepSeek的模型是开源的,但全球云服务厂商们对模型的支持仍然十分关键。通过支持DeepSeek模型的云平台,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等一系列繁琐步骤,直接在云服务厂商的平台上去调用DeepSeek模型。客观来说,像DeepSeek-V3这样的MoE模型总参数量有671B,部署门槛并不低。同时开发者还能在平台上以更少甚至零代码去实现从训练到部署再到推理的全过程,AI开发和应用的流程更简单、更高效。

DeepSeek朋友圈阵容豪华,合作共赢才是未来AI发展必由之路

DeepSeek给整个AI产业带来的影响是全方位、多层次的,除了自身模型的优秀,DeepSeek对于产业的带动效应更值得关注,从芯片产业到上层云服务产业,几乎所有头部玩家和创企都在积极涌入DeepSeek“生态圈”。有业内人士称,DeepSeek如此之快的爆发速度,一方面刺激着各路厂商加速适配模型,另一方面也刺激着算力产业的整合,随着模型同质化趋势凸显、开源模型的加速成长,AI应用生态层的商业价值会越来越高,应用层竞争也将成为后续行业聚焦的重点。DeepSeek无疑正在重塑全球AI产业的竞争版图,中美之间的AI竞争格局也在改变。算力神话被打破、更多玩家有机会在AI新时代更轻松地拿到“入场券”,AI应用生态的发展也愈发重要。正如DeepSeek创始人梁文锋近日在接受《暗涌》采访时提到的,在这波AI浪潮中,DeepSeek的出发点是走到技术前沿,去推动整个生态发展。正如英伟达的领先不只是一个公司到努力,也是整个西方技术社区和产业共同努力的结果,中国AI的发展,同样需要这样的生态。梁文锋说,DeepSeek希望形成一种生态,他们只负责基础模型和前沿的创新,其它公司在DeepSeek的基础上构建toB、toC的业务。中国知名生物学家、北京大学终身讲席教授饶毅近日发布了题为“鸦片战争以来,中国对人类最大的科技震撼:DeepSeek”的文章,激起广泛热议。毫无疑问,DeepSeek给海外诸多产业和领域都带来了巨大震撼,中美之间的AI竞争仍然事态焦灼、充满不确定性。中国AI或许正走在一个历史最关键时刻。正如傅聪所说:“我们不需要更多的禁令,中美作为在当今人工智能领域最领先的两个国家,不能不合作。只有共同合作发展,才能弥合数字和智能鸿沟,特别是帮助全球南方在人工智能发展进程中平等受益。”

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值的内容,就在 32度域 扎堆
(0)
上一篇 2025年2月5日 09:58
下一篇 2025年2月6日 23:11

猜你喜欢

  • AI人工智能

    DeepSeek-R1编程登顶引发算力供给思考

    2025 年 AI 上半场激战落幕!DeepSeek-R1(0528)凭编程实力突围,在国外最新排行榜中与国外大模型并列第一。当 AI 上半场的模型竞技尘埃落定,技术焦点正悄然转向算力基建。从 DeepSeek-R1 的编程突围到算力互联布局,行业逻辑已从单一模型比拼,转向算法创新与算力协同的深水区,下半场的竞争核心正聚焦于基础设施的落地与效能。

    本月,工信部正式印发《算力互联互通行动计划》,为构建高效协同的算力互联互通体系锚定方向。规划显示,2026 年将全力提升网络互通效能,建成多级调度平台实现算力供需的精准对接;到 2028 年,着力打造智能便捷的算力互联网,为人工智能、科学计算、智能制造等领域的创新发展注入强劲动能。

    国家主导公共算力“大网格”,第一线深耕私域算力“小网格”,二者构成对企业互补加持意义。算力互联网通过整合公共算力资源,解决资源利用率低、调度能力不足等问题,对多区域、行业层面数字经济高速发展形成普惠效益。

    在政策与技术的双重驱动下,算力基建的蓝图已清晰展开。从国家级的算力互联规划,到企业级的技术创新实践,一场从宏观布局到微观落地的变革正在上演。公共与私域算力 “网格” 的协同发力,正为行业发展开辟全新路径。

    比如,第一线DYXnet正在联合华为等伙伴构建的算力互联成果——AI原生超互联架构,对企业个性私域智算场景具备定制化价值。

    据了解,第一线依托AI原生超互联架构底盘,融合母公司AIDC、公有云伙伴(包括火山引擎、阿里云、华为云等)、OCD边缘算力云等云边端多梯次算力资源,并与合作伙伴进行产研侧创新,打造云安全等多方面安全服务能力,实现多主体、多架构算力安全调度,对接企业面向“私域”与“公域”各场景的AI训推需求。随着第一线与多算力生态伙伴联合携手,以及自身不断创新,未来将持续释放更大算力协同价值。

    依托云边端协同的 “专有 AI 算网”,第一线搭载集成多类型 AI 大模型的 AI MaaS 服务,为企业提供全流程、一站式的算力支持与模型服务。这一合作生态中,第一线与火山引擎、腾讯云合作伙伴持续迭代技术能力,通过优势互补实现协同增效,不断推出创新解决方案,推动服务效能跨越式提升,为企业数智化转型注入强劲生态动能。

    基于AI算网+大模型融合服务能力,第一线正积极与制造、教育等领域客户展开深度合作,提供从方案规划、开发工具支持到模型优化的全流程服务,助力企业搭建私域 AI 大模型应用体系。

    以制造业头部企业旭日国际集团为例,面对复杂网络环境、数据安全挑战及高昂的 AI 工具自研成本,第一线为其量身定制数智化解决方案。分阶段落地 ChatV AI 助手与 ChatBI 智慧数据系统,融合前沿 AI 大模型,实现高效智能交互。两项应用部署于第一线 OCD 边缘算力云,赋能智慧办公与商业决策。

    从政策驱动的算力基建顶层设计,到企业技术创新的实践探索,第一线通过构建算力生态与深化行业应用,为企业数智化转型提供了可复制的解决方案。未来,随着 AI 技术与算力基础设施的深度融合,这场由政策、企业与技术共同推动的变革,有望为各行业发展注入新动能,助力数字经济迈向更高质量发展阶段。

    免责声明:此文内容为本网站转载企业资讯,仅代表作者个人观点,与本网无关。所涉内容不构成投资、消费建议,仅供读者参考,并请自行核实相关内容。

    原文转自: 周口网

    本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
    如对本稿件有异议或投诉,请联系 lin@sentgon.com
    👍喜欢有价值的内容,就在 32度域 扎堆
    2025年6月27日
    000

发表回复

登录后才能评论