DeepSeek低成本AI模型震惊全球科技圈!美韩破防

DeepSeek低成本AI模型震惊全球科技圈!美韩破防

几乎是一夜之间,“来自东方的神秘力量”又一次击中海外人士心脏。

近两日,国产AI黑马DeepSeek(深度求索)在全球科技界刷屏。新模型发布后的访问量激增,一度让DeepSeek闪崩,但问题在数分钟内得到解决。AI界上一次出现宕机情况,还是月之暗面的Kimi出圈爆火之时。

截至发稿,DeepSeek在美区苹果App Store的免费排行榜中飙升至第二,第一是ChatGPT。

DeepSeek低成本AI模型震惊全球科技圈!美韩破防

▍与OpenAI“掰手腕”

DeepSeek本次“刷屏”,起因是1月20日其正式发布推理大模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现,能与OpenAI的最强推理模型o1“掰手腕”,但其API调用成本却低了90%-95%。

DeepSeek-R1的惊艳表现,先是引发了海外市场的强烈关注。在美国,多位AI行业的资深专家和从业者盛赞DeepSeek-R1。

美国计算机科学家、萨姆·奥尔特曼的导师吴恩达在第55届世界经济论坛(冬季达沃斯)上点赞DeepSeek——“我对 DeepSeek 的进展印象深刻。我认为他们能够以非常经济的方式训练模型。他们最新发布的推理模型,非常出色……‘加油’!”。

微软CEO萨蒂亚·纳德拉也公开表示,“他们(DeepSeek)切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”纳德拉还强调,“我们必须非常、非常认真地对待中国的这些进展”。

DeepSeek低成本AI模型震惊全球科技圈!美韩破防

DeepSeek成立于2023年5月,其背后是国内对冲基金巨头幻方量化。

2023年11月2日,DeeSeek推出首个模型DeepSeek Coder,该模型免费供商业使用且完全开源。2023年11月29日,DeepSeek LLM上线,其参数规模达到 67B,性能接近 GPT-4,同时还发布了该模型的聊天版本 DeepSeek Chat。

真正让Deepseek在AI界出圈的,是其在2024年5月开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一,DeepSeek由此被称作“价格屠夫”、“AI界的拼多多”。

随后的2024年下半年,这家公司还先后发布了DeepSeek R1-lite-preview和DeepSeek-V3。

到了2025年推出的R1模型,在数学能力测试中,该模型在MATH基准测试上达到了77.5%的准确率,与OpenAI的o1不相上下;在编程领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。

而这一切,是在不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。

  • DeepSeek曾导致微软股价出现波动

1月30日,微软公司首席执行官萨提亚·纳德拉(Satya Nadella)对国产人工智能大模型公司DeepSeek表达了积极评价。本周早些时候,DeepSeek曾导致微软股价出现波动。

这家新兴企业凭借其开源AI模型R1震惊了美国科技行业。DeepSeek声称,该模型在性能上可与西方同类模型媲美甚至超越,但成本仅为其一小部分。

微软首席执行官萨提亚·纳德拉(Satya Nadella)在周三微软公布季度财报后的投资者电话会议上表示:“DeepSeek确实带来了一些真正的创新。显然,现在所有这些都会被商品化,并广泛应用。”

DeepSeek的突破让投资者开始思考,微软是否真的需要在AI基础设施上投入如此巨额的资金。微软和其合作伙伴OpenAI是否可以用更低的成本训练AI模型并处理用户查询(即推理过程)?

对此,纳德拉表示,他们已经在这样做了。

纳德拉称,“我们自己在训练和推理方面多年来一直在实现显著的效率提升”。微软利用自身软件优化AI模型和AI硬件的每一代升级,以提高性能并降低成本。

纳德拉指出,微软的许多工作是与OpenAI合作完成的。他补充说,光是发布最先进的模型还不够,关键是要让其具备成本效益。如果运行成本太高,那就毫无意义。

尽管如此,微软仍计划在本财年投入800亿美元建设数据中心,以满足客户对其AI产品的需求。不过,公司预计从2026财年(7月1日开始)起,这部分支出的增长将逐渐放缓。

此外,周三,微软宣布已将DeepSeek的R1模型添加到其Azure AI Foundry平台,该平台包含超过1800个AI模型,供企业用于设计和管理AI程序。

当地时间1月29日,微软公布截至2024年12月31日的2025财年第二财季业绩,财报发布后,微软盘后股价跌超4%。

  • 中国AI新创DeepSeek挑战美国优势,白宫警钟:领先仅3-6个月

中国新创公司深度求索(DeepSeek)的生成式人工智能(AI)模型引发全球关注。据白宫AI与加密货币负责人塞克斯28日表示,尽管美国在AI领域仍然处于主导地位,但其领先中国的优势仅剩3至6个月。他警告,美国公司过去可能过于自满。塞克斯在接受福斯新闻采访时表示,DeepSeek的生成式AI可以与美国人工智能研究室OpenAI开发的ChatGPT媲美。

尽管OpenAI正在开发下一代模型,但其领先优势只有3至6个月。此消息引发了外界对美国在AI领域优势的质疑,导致AI芯片大厂NVIDIA等科技股票在27日重挫。美国总统特朗普也表示,DeepSeek对美国企业来说是一个警钟。尽管如此,白宫发言人李威特表示,特朗普相信美国能够重新夺回AI领域的主导地位。在特朗普的支持下,OpenAI、软银和甲骨文的合资企业Stargate正在全美范围内建设数据中心,总投资达到5000亿美元。然而,DeepSeek声称他们能够以较不先进、较少的芯片训练强大的AI模型,这使得人们质疑美国是否在AI建设上投入过多。

对此,塞克斯指出,美国禁止高阶芯片出口到中国,因此中国必须充分利用他们能够获得的芯片,提高芯片的效能。他认为,美国的出口限制成为了中国创新的动力。同时,塞克斯也指出,美国必须赢得AI竞赛。他批评美国的AI公司过去可能过于自满,没有意识到中国的AI公司与他们的差距其实并不大。他还批评前总统拜登对AI发展提出过多的管制措施,束缚了美国AI公司的发展。他认为,DeepSeek的发展证明了特朗普推翻拜登时代的管制措施是正确的。

本内容为作者独立观点,不代表32度域立场。未经允许不得转载,授权事宜请联系 business@sentgon.com
如对本稿件有异议或投诉,请联系 lin@sentgon.com
👍喜欢有价值有态度的内容,就在 32度域 扎堆
(0)
上一篇 2025年1月25日 14:34
下一篇 2025年2月5日 09:58

猜你喜欢

发表回复

登录后才能评论