-
近日,在Alphabet 2025年第一季度财报电话会议上,谷歌CEO桑达尔·皮查伊向外界披露了一系列关键数据与战略进展,揭示了谷歌在人工智能(AI)驱动下的业务转型与突破。其中,AI在谷歌代码开发中的广泛应用、核心业务板块的稳健增长以及Gemini2.5Pro模型的卓越表现,成为市场关注的焦点。
超 30% 的代码由 AI 生成
皮查伊透露,谷歌内部代码开发正经历一场由AI引发的深刻变革。目前,谷歌超过30%的代码由AI辅助生成,这意味着开发者每三次代码修改中,就有一次直接采纳了AI的建议。这一转变背后,是谷歌在AI辅助编程领域的技术突破与流程优化。
皮查伊特别提到“主动工作流程”的引入。这一AI系统能够自主规划并执行多步骤任务,大幅提升了开发效率与代码质量。目前,谷歌正将这一技术向公司各个部门推广,客户服务团队因其在AI应用中的领先实践,成为内部标杆。这一变革不仅缩短了产品迭代周期,更使开发者能够专注于更高层次的架构设计与创新。
财报显示,Alphabet在2025年第一季度交出了一份稳健的成绩单。公司整体收入同比增长12%,达到902亿美元,尽管环比略有下降,但核心业务表现依然强劲。净收入同比激增46%至345亿美元,稀释每股收益上升49%至2.81美元,营业利润率从32%扩大至34%,盈利能力显著提升。
谷歌的核心广告业务仍是收入支柱。Google搜索和其他收入增长至507亿美元,YouTube广告收入达89亿美元,订阅、平台和设备收入也达到104亿美元。然而,最引人注目的是谷歌云业务的爆发式增长。该季度云业务收入同比增长28%,达到123亿美元,主要得益于企业对核心云产品、AI基础设施及生成式AI解决方案的强劲需求。这一表现凸显了谷歌在云计算市场的竞争力,也印证了AI技术对商业增长的驱动作用。
从产品应用到科研突破
作为谷歌AI战略的核心,Gemini2.5Pro模型的推出引发了开发者与消费者的广泛关注。皮查伊自豪地表示,该模型在多项基准测试中表现“首屈一指”,尤其在聊天机器人领域首秀即登顶。这一成就源于Gemini2.5Pro在推理、编码、科学和数学等领域的重大改进,为开发者与客户开辟了全新的应用场景。
数据显示,自年初以来,AI Studio和Gemini API的活跃用户增长超过200%,用户对Gemini模型的需求呈现爆发式增长。目前,Gemini已嵌入谷歌所有15个核心产品,覆盖超过5亿用户。Android与Pixel产品率先落地Gemini Live和AI驱动的相机工具,而谷歌助手也将在今年晚些时候升级为Gemini版本,并扩展至平板电脑、智能手表和汽车等终端。此外,Gemini模型的下载量已突破1.4亿次,成为全球用户触达AI技术的关键入口。
谷歌的AI布局不仅限于消费级产品,更延伸至前沿科研领域。皮查伊强调了AI开发的新前沿,包括Gemini机器人模型和“AI联合科学家”多智能体系统。后者是一个专为科学研究设计的AI平台,能够通过跨学科协作加速创新进程。
在生物科技领域,谷歌旗下的AlphaFold在蛋白质结构预测方面取得了里程碑式突破。目前,已有超过250万名研究人员使用这一技术,为药物研发、疾病治疗等领域带来了革命性工具。这一案例不仅展示了AI在科研中的潜力,也凸显了谷歌在AI伦理与开放生态建设中的领导力。
AI重塑搜索与硬件体验
在搜索领域,谷歌通过AI概述功能进一步巩固了其市场地位。目前,该功能每月为超过15亿用户提供服务,显著扩展了谷歌能够回答的问题类型。无论是复杂的长尾查询还是实时数据需求,AI概述都能通过自然语言处理技术提供精准答案,极大提升了用户体验。
硬件方面,谷歌在最新发布的Pixel9a和三星S25等Android设备中,集成了Gemini Live屏幕共享和AI驱动的相机工具。这些功能不仅提升了设备的智能化水平,也为用户提供了创作、交互与娱乐的全新方式。例如,AI相机能够自动识别场景并优化拍摄参数,而Gemini Live则支持多设备间的无缝协作,进一步模糊了硬件与软件的边界。
皮查伊在财报会议上重申了谷歌对AI技术的长期承诺。他表示,随着更强大的模型与主动工作流程的普及,AI将在谷歌的各个业务板块中发挥更大作用。无论是提升广告效率、优化云服务,还是推动硬件创新,AI都将成为谷歌保持竞争力的核心驱动力。
此外,谷歌正通过开放生态与合作伙伴计划,加速AI技术的普及。例如,Gemini API的广泛应用使开发者能够轻松构建AI驱动的应用,而AI联合科学家项目则促进了全球科研机构的协作。这些举措不仅巩固了谷歌在AI领域的领导地位,也为全球数字化进程注入了新动能。
Alphabet 2025年第一季度的财报不仅展现了谷歌在财务表现上的稳健增长,更揭示了AI技术对其业务模式的深度变化。随着Gemini2.5Pro等技术的持续迭代,谷歌的AI生态有望在未来释放更大的商业价值与社会影响力。
谷歌 CEO 皮查伊:超 30% 的代码由 AI 生成
2025年4月27日 -
4月24日,在国新办举行新闻发布会上,介绍2024年中国知识产权强国建设有关情况。国家知识产权局局长申长雨表示,目前,我国人工智能领域呈现良好的发展势头。世界知识产权组织报告显示,中国已经成为全球人工智能专利的最大拥有国,在全球的占比达到60%。
数据绝非偶然,而是中国多年来在人工智能领域深耕细作、厚积薄发的有力证明。
人工智能产业的蓬勃发展,离不开完善的企业生态体系。2024年4月,工业和信息化部披露的数据显示,我国人工智能企业数量已超过4500家。这些企业如同繁星点点,分布在“底层 - 中层 - 顶层”的每一层架构中,共同构建起一个围绕AI技术、产品和服务的完整生态圈。
我国人工智能行业以应用层企业为主,基础层企业虽数量相对较少,仅有428家,在4311家人工智能骨干企业中占比9.93%,但它们却是中国人工智能科技产业发展的基石。这些企业专注于基础软硬件和基础设施服务,为整个产业提供了坚实的支撑。
技术层企业数量为1233家,占比28.60%,它们是关键技术研发和生产的“主力军”,在核心算法等关键领域不断探索创新,为人工智能的发展注入源源不断的技术动力。
而应用层企业数量最多,达到2650家,占比61.47%,它们如同“先锋部队”,将人工智能技术集成并应用到各个行业,推动着人工智能技术在商业领域的落地生根,让更多人切实感受到人工智能带来的便利与变革。
在科技竞争日益激烈的今天,只有不断加大研发投入,才能在核心技术上取得突破,在全球人工智能产业格局中占据一席之地。
根据《中国新一代人工智能科技产业发展报告2022》,在中国人工智能上市企业中,共有197家公布了研发投入数据。其中,研发强度在5% - 10%之间的企业数量最多,占比为36.35%;研发强度大于10%的企业占比33.5%,平均研发强度达到9.98%,远超国内企业的平均水平。
作为人工智能领域的知名学者,吴恩达认为人工智能是一场新的工业革命,它将像电力一样广泛地改变各个行业。他强调了深度学习在人工智能发展中的重要性,并积极推动人工智能技术在医疗、交通等领域的应用。他还认为,人工智能的发展需要大量的数据和强大的计算能力,同时也需要关注人工智能的伦理和社会问题。
中国工程院院士沈昌祥认为,人工智能是指通过人类设计和编程,使智能机器能够完成各种复杂任务,从而取代传统人工角色。他强调安全问题至关重要,人工智能衍生出自身失误、智能硬件被恶意袭击以及机器人(16.280, 0.08, 0.49%)智能行为体失控等重大风险,需构建由法律、战略和制度等组成的安全可信保障体系。
本文来自:前瞻网,原文标题:《遥遥领先,全球占比达到60%!中国成为全球人工智能专利最大拥有国》 ,题图来自:网络
全球占比达到60%!中国成为全球人工智能专利最大拥有国
2025年4月26日 -
4月20日,以“智能驱动 东盟共赢”为主题的“千企南宁行——南宁·中关村人工智能+国际创新生态大会”在南宁·中关村创新示范基地拉开帷幕。作为中国面向东盟开放合作的前沿窗口,广西正以人工智能为纽带,加速构建跨国创新生态圈。活动期间,南宁高新区与润建股份签署战略合作框架协议,通过人工智能技术赋能区域产业升级;越南、柬埔寨等东盟国家的中关村跨境平台项目同步落地,标志着中国与东盟在人工智能领域的合作从技术交流迈向深度产教融合与产业协同的新阶段。
会上,南宁中关村信息谷公司携手广联达、瑞莱智慧、中文在线等15家领军企业,围绕跨境AI多语种智能客服、数字文化应用、大模型安全基座等前沿领域展开合作,并联合京津冀、粤港澳及本地高校、科研机构共建人工智能生态联盟。值得关注的是,7家人工智能企业现场发布创新成果:数道智算推出的“DeepSeek一体机”以算力集约化重构产业基础设施,东华医为的“数字化医疗平台”推动诊疗流程智能化,瑞莱智慧的“大模型安全基座”破解AI伦理难题,润建股份的“RunWIM数字人”则开启人机协同新场景。从智慧政务到数字农业,从工业视觉到产教融合,南宁·中关村正以AI技术穿透产业边界,形成覆盖研发、应用、服务的全链条生态。
活动亮点之一是首度启用人形机器人“夸父”发布《南宁·中关村人工智能+产业发展规划报告》,这一象征性场景折射出当地AI产业的蓬勃态势。目前,南宁·中关村已集聚百余家“人工智能+”企业,在AI平台开发、智慧农业、智能制造等领域形成特色集群。未来十年,该基地计划通过强化技术攻关、场景开放和跨境协作,推动千家企业集聚、千亿规模产业生态构建,打造中国—东盟人工智能创新合作示范区。这一蓝图不仅将深化区域数字经济融合,更通过技术共享、标准共建与人才共育,为构建亚洲数字命运共同体注入新动能。
南宁·中关村人工智能+国际创新生态大会举行
2025年4月25日 -
本文来自: 新浪科技,作者:郑峻
“从下个月开始,我留给政府效率部(DOGE)的时间将大幅减少”。面对着特斯拉的惨淡业绩,马斯克终于无奈服软,承诺自己会减少在白宫的时间,将更多的精力留给上市公司特斯拉。
这是他不得不面临的选择。在特斯拉股价腰斩之后,长期看好特斯拉的Wedbush分析师丹·艾夫斯(Dan Ives)警告称,若马斯克不释放退出DOGE的信号,特斯拉将面临”红色警报”,已走到了“十字路口时刻”。
而在马斯克宣布减少在DOGE工作时间后,艾夫斯认为这标志着”马斯克在特朗普政府时代的终结开端”。看起来,投资者似乎认同这一乐观预期,带动特斯拉昨天盘后股价上涨5%。
当然,骄傲的马斯克并不会就此放弃自己的政治野心,他表示,自己还会每周在白宫工作1-2天,而且在特朗普政府的剩余任期内(到2029年1月),还会继续参与联邦政府的工作。
毕竟,与白宫的特殊关系是马斯克目前最大的政治资本。他投入了超过2.7亿美元帮助特朗普再度当选美国总统,因此得到了丰厚的政治回报。马斯克不仅成为了特朗普总统最亲密的朋友和高级顾问,甚至获得了白宫的专属办公室,可以频繁见到总统本人。
特朗普总统当选之后,履行承诺让马斯克领导政府效率部,全权负责美国联邦政府的机构改革和预算削减。在过去三个月时间,马斯克的政府效率部获得了诸多核心政府部门的关键数据,更对诸多监管部门进行了大刀阔斧的裁员和削减预算。
在很多美国人眼中,马斯克如今已经成为美国的“影子总统”。他每天都在自己的社交平台上,对美国社会民生甚至全球外交局势不断发表自己的意见观点,而且还能凭借自己与特朗普的特殊关系,影响到白宫的内政外交政策。
最新财报水深火热
但就在马斯克政治权势通天的同时,他商业帝国最重要的版图特斯拉却陷入了多年来的最低谷。刚刚发布的特斯拉第一季度财报,用水深火热来形容并不夸张:净利润同比暴跌71%,汽车销售收入下滑20%,总收入下滑9%。
这份惨淡的财报早在外界预料之中。因为此前特斯拉公布的季度交付数据同比下滑13%,创下公司历史上最大季度降幅。需要强调的是,销量暴跌是特斯拉自己的问题,因为第一季度全球电动车销量增长了7%,其他电动车型都迎来了销量增长,中国厂商更是表现强劲。
为什么特斯拉销量会下滑如此严重?
和乔布斯一样,马斯克也存在“现实扭曲力场”。在财报发布之后的分析师电话会议中,马斯克驳斥了“特斯拉市场需求下滑”的观点。他认为,如果没有宏观经济因素,公司车辆需求依然保持旺盛,第一季度销量下滑主要是因为市场在等待改版Model Y上市。
这的确是一个重要因素。占据特斯拉销量95%的两款车型Model 3和Model Y都已经销售多年,在诸多竞争对手车型不断涌现下,尤其是来自中国车企的激烈竞争下,很难再吸引新的消费者。即便是有意购买特斯拉的消费者,也会选择等待新版Model Y交付。
马斯克曾经表示,电动皮卡Cybertruck预定超过百万辆,但今年3月的召回报告显示,Cybertruck上市迄今的实际销量只有4.6万辆。而且,第一季度销量更是环比下滑了约50%。特斯拉不得不推出高额促销来化解累计超过数亿美元的库存。
但不可否认的是,马斯克的政治争议已严重损害到了特斯拉品牌。鉴于他的个人形象已经与特朗普政府高度绑定。许多民众都认为,购买特斯拉如今等同于支持马斯克与特朗普,这种认知正驱使部分潜在买家转向其他品牌,尤其是特斯拉原本的主要消费群体——关注环保的自由派民众。
马斯克对美国联邦政府的暴力裁员和削减预算也触怒了大批民众。据不完全统计,DOGE迄今已在美国联邦政府多个部门机构裁减了约 10 万名员工,未来还计划进一步裁撤约 30 万个联邦政府职位。包括联邦雇员和承包商在内,这可能导致总计近 100 万人失业。
过去几个月时间,全美各地的特斯拉门店每周都会迎来抗议示威活动,甚至出现了诸多打砸门店、焚烧车辆和充电设施的暴力犯罪事件。尽管特朗普政府将打砸特斯拉门店定性为“国内恐怖行为”,成立专项小组进行严打,但这无法阻止民众用钱包投票,用拒绝购买来抵制特斯拉和马斯克。
政治争议拖累特斯拉
4月份的一项民意调查显示,马斯克在美国成年人的净赞赏率(正面评价和负面评价之间的差值)已经跌到负20%,而在民主党选民中的净赞赏率更是降到负82%,即便在中间选民中,这一数据也是负49%。对马斯克的负面看法也直接体现在了特斯拉的销量中。
特斯拉并不会按照市场公布销量。Cox的统计数据显示,今年第一季度特斯拉在美国交付量约为12.81万辆,同比下滑8.6%。而Electrek则对此预计为11.96万辆,同比下滑14.6%。与此同时,美国电动车总销量增长10.6%,达到29.425万辆。
为了提振销量,特斯拉不断进行促销,这直接伤害了利润率。特斯拉汽车业务毛利率已经从2022年峰值时的28.5%急剧下滑到目前的15.5%。如果排除高达6亿美元的监管信用营收,特斯拉汽车业务的毛利率甚至只有12.5%。
据汽车资讯网站iSeeCars.com数据,过去一年美国市场二手特斯拉价格下跌10.1%,而整体二手车价上涨1%。这损害了现有车主利益,也为新车销售亮起红灯。由于特斯拉拥有大量租赁车辆的所有权,贬值直接冲击公司财务。特斯拉也不得不承认,二手车贬值加剧了利润压力。
特斯拉的危机不仅是在美国市场。自信心极度膨胀的马斯克多次干预欧洲政治,在德国大选背书极右派“德国选择党”,更不断与欧洲政府领导人发生口角。这些争议言行引发的政治反弹也都落到了特斯拉身上,法国、意大利等国同样出现了特斯拉门店和车辆遭到焚烧打砸的暴力事件。
特斯拉在欧洲市场的业绩只能用雪崩来形容。第一季度,特斯拉在欧洲市场销量下滑了37%。除了英国市场,特斯拉在欧洲所有市场都出现了断崖式下跌,德国、法国两个最大市场的销量更是同比暴跌了62%和41%。
然而,骄傲的马斯克并不愿意承认自己给特斯拉带来的伤害。在财报发布后,他在分析师电话会议中表示,“如果美国这艘船沉没,我们都会跟着遭殃”,以此为自己削减联邦政府预算和裁员的举措辩护。马斯克给了自己一个台阶:减少DOGE工作是因”主要任务基本完成”,而非特斯拉压力。
马斯克还表示,反对自己的人都是”那些曾获取浪费性欺诈资金的人”,还称抗议者是"拿了钱的"。组织抗议的团体"特斯拉拆除联盟"发表声明称,参与者均为志愿者,"讽刺的是,说这话的人曾花费2.77亿美元助特朗普当选"。
虽然马斯克并不愿意承认自己有错,但在业绩和股价的沉重压力下,他不得不做出让步,至少暂时给市场释放利好信号:自己会更多专注于特斯拉,而减少在政坛的投入程度。
无人车即将试运营
然而,即便马斯克开始削减在特朗普政府的投入,特斯拉还有怎样的增长空间?前特斯拉董事会成员史蒂夫·韦斯特利(Steve Westly)在接受CNBC财经频道采访时表示,特斯拉需要尽快找到新的增长引擎。
看起来,马斯克把特斯拉的未来押注在无人车和人形机器人两大前沿科技上。他在电话会议上表示,“特斯拉的未来,基本上取决于大规模的自动驾驶汽车以及大批量生产的自动化人形机器人。”
具体而言,他希望通过无人驾驶特斯拉车辆,打造出租车队来赚钱。 他将特斯拉的自动驾驶能力描述为“利用人工智能的一种通用解决方案”。
马斯克介绍称,特斯拉会在今年6月在德州奥斯汀开始试点推出无人驾驶出租车服务,一开始可能只有“大约10到20辆车”,之后会“迅速扩大规模”。“一旦我们在几个城市实现了它,我们基本上可以在该法律辖区内的所有城市运行它,”他说。
但他强调,首批特斯拉无人驾驶出租车会是通过软件更新实现自动驾驶的Model Y车型,而不是去年发布的Cybercab。“通过软件更新,它就会变成自动驾驶车辆,”马斯克说。“明确一点,6月在奥斯汀运行的这些自动驾驶Model Y,是我们当前生产的Model Y。没有任何硬件改动。”
“我预测明年下半年会有数百万辆特斯拉实现自动驾驶——完全自动驾驶。”马斯克没有提供特斯拉扩展计划的具体时间表,但给出了一些相当大胆的预测,预计特斯拉会占据超过九成的打车市场份额。
他显然对这些数字充满信心,因为理论上,任何一辆在路上的特斯拉车辆都可以通过软件更新,变成无人驾驶出租车。这不同于谷歌旗下的Waymo,后者不仅依赖传感器和摄像头硬件,还需要提前绘制城市地图,才能在某个区域部署其无人驾驶出租车。
不过,分析师对他的乐观预期提出了质疑。特斯拉的高级辅助驾驶技术FSD目前只是L2+的级别,暂时还没有做到无监管自动驾驶(L3)的地步。而做到Waymo那样的无人驾驶出租车队,则需要L4级别的自动驾驶技术。特斯拉目前甚至刚刚在加州申请到无人车上路内部测试的许可。
Waymo的无人驾驶出租车已在凤凰城和旧金山提供付费乘车服务数年,并正在扩展到更多地区。上个月,Waymo表示在四个城市每周完成约20万次付费乘车,并计划扩展到华盛顿,还在东京测试其车辆。
去年发布的Cybercab则是一个单独的产品。特斯拉副总裁、车辆工程负责人莫拉维(Lars Moravy)在电话会上表示,Cybercab目前处于车辆的“B样车验证”阶段,正在制造接近最终产品材料的原型车,将在第二季度末启动生产,而大规模量产仍按照原计划定于明年启动。
特斯拉预计会利用公司所谓的“Unboxed”制造方法,快速实现Cybercab的大规模生产。传统汽车制造商采用流水线方式造车,而特斯拉则采用了新方法:车辆的不同部分在不同区域同时组装,最后再合并成整车。
此外,马斯克还在财报电话会上,重申了人形机器人在公司未来战略中的关键地位,称这是特斯拉未来业务重要组成部分。此前特斯拉曾经表示,今年就将生产超过5000部人形机器人Optimus并部署在工厂中。
不过,与电动车行业的行业格局相似,特斯拉的人形机器人也将面临来自中国企业的激烈竞争。中国的宇树科技和智元机器人预计也将在今年进入大规模生产。尽管马斯克对特斯拉在机器人领域的发展前景充满信心,但他也承认,未来的市场可能会被中国企业占据主导。(郑峻)
特斯拉水深火热,马斯克押宝无人车和机器人
2025年4月24日 -
4月24日,国新办举行新闻发布会,介绍2024年中国知识产权强国建设有关情况。国家知识产权局局长申长雨表示,中国已经成为全球人工智能专利的最大拥有国。
人工智能是新一轮科技革命和产业变革的重要驱动力量。目前,我国人工智能领域呈现良好的发展势头。申长雨表示,世界知识产权组织报告显示,中国已经成为全球人工智能专利的最大拥有国,在全球的占比达到60%。
记者在会上了解到,近年来,国家知识产权局积极回应人工智能新领域、新业态、新模式发展的需要,深入推进人工智能领域知识产权制度创新,为人工智能技术发展和产业发展提供有力的制度供给。包括及时修改完善《专利审查指南》,发布《人工智能相关发明专利申请指引》,积极回应和解决了有关人工智能专利申请主体、保护客体、审查标准等热点问题。聚焦人工智能重点领域,为相关专利申请提供快速审查服务,严厉打击抢注“DeepSeek”等相关商标申请行为,持续强化知识产权保护,护航人工智能领域科技创新。与此同时,国家知识产权局还加快人工智能技术在知识产权领域的运用,推动知识产权工作数字化转型和智能化升级,不断提升知识产权治理效能。
申长雨表示,面向未来,国家知识产权局将积极推动知识产权与人工智能共生演进、双向赋能、融合发展。
一是持续推进人工智能相关知识产权制度创新,加快建立人工智能、大数据等新领域新业态知识产权保护规则,为发展人工智能技术提供更加有力的法治保障。
二是提高人工智能知识产权保护和运用水平,健全知识产权支撑关键核心技术攻关工作体系,加大人工智能领域专利申请按需审查服务力度,做好相关发明专利分析预警和导航服务,指导建设人工智能领域专利池,深入实施专利转化运用专项行动,促进更多人工智能领域专利从实验室走向产业链,赋能相关产业发展。
三是积极参与人工智能领域知识产权全球治理,推动完善相关国际规则和标准,促进全球人工智能产业发展,让人工智能技术更好造福全人类。
我国成人工智能专利最大拥有国
2025年4月24日 -
日前,由清华博士曹越创立的 Sand.AI,公布了一款名为「Magi-1」的自回归视频生成模型,其主打两个能力:
- 无限长度扩展:通过前一段生成的内容进行后一段视频的制作,从而实现跨时间的无缝连贯叙事;
- 生成时长控制精准到每一秒。
而从公布的数据显示,具体性能测试结果如下:
- Physics-IQ(对多种物理定律的理解)基准测试:Magi-1 获得 56.02% 的高分成绩,超越可灵 1.6、Sora 等一众模型;
- 人类评估:与海螺、腾讯混元、通义万相 Wan2.1 相比,Magi-1 在指令跟随和运动质量等方面更具优势,但与可灵 1.6 在视觉质量存在差距;
- VBench-I2V 基准:Magi-1(2 倍解码器)以 89.28 的高分排名第一,在动态程度(Dynamic Degree)上有较大优势。
技术上,Magi-1 整体架构基于 Diffusion Transformer,采用 Flow-Matching 作为训练目标。
值得一提的是,据公布的信息显示,Magi-1 通过自回归去噪方式预测固定长度的视频片段,提高了视频生成效率和前后因果性(保证前后内容生成逻辑一致)。
目前,Magi-1 已上架 Sand.AI 官网(可以免费体验!),并且模型权重、代码也进行 100% 开源,技术报告也进行全面公布。
而背后的 Sand.AI 创始人为曹越,其博士毕业于清华大学软件学院,并于 2018 年获清华大学特等奖学金。曹越于 2022 年创办 AGI 公司「光年之外」,后加入智源研究院领导多模态与视觉研究中心。随后在 2023 年,曹越创立了 Sand.AI,并很长一段时间与其他成员保持「隐身」状态。
团队成员方面,有不少与曹越有着类似的历程:智源研究院实习、光年之外创始成员、微软亚洲研究院实习等等。另据了解,San.AI 已完成三轮融资,主要参与方包括今日资本、经纬创投等。
清华博士带队,发布全球首个自回归视频生成大模型「Magi-1」
2025年4月23日 -
全球经济的航程正驶入一片未经探索的深水区,而欧洲在这波剧烈变动的格局中,赫然矗立于战略抉择的十字路口。当人工智能(AI)与高性能计算(HPC)成为重塑全球竞争力的核心引擎,这片大陆既面临着技术革命带来的空前机遇,也承载着地缘政治博弈加剧的严峻挑战。
今年二月,一场汇聚百国代表的AI未来峰会(AI2025)在巴黎落下帷幕,OpenAI首席执行官萨姆·奥特曼、Anthropic联合创始人达里奥·阿莫代伊与DeepMind首席科学家戴米斯·哈萨比斯等科技巨擘齐聚一堂,共同签署了强调"开放协作、伦理透明、普惠增长"的联合宣言。然而耐人寻味的是,作为AI竞赛的领跑者,美国与英国最终选择缺席这份承载未来愿景的承诺书。
就在全球AI治理框架的博弈持续发酵之际,科技巨头与欧盟监管体系的碰撞再度成为焦点。早两日的消息,Meta公司在经历近一年的政策博弈后,宣布将恢复使用欧盟用户公开的社交媒体内容训练其AI模型。这一决定背后,是《通用数据保护条例》(GDPR)构筑的数字藩篱与科技企业数据渴求之间的激烈角力。
自2024年6月因爱尔兰数据保护委员会(DPC)的反对暂停计划以来,Meta在欧盟的AI部署始终滞后于全球其他市场。尽管该公司早已在美国市场大规模运用用户生成内容优化算法,但欧盟严格的隐私监管要求——尤其是GDPR对处理个人数据的合法性审查,迫使其不得不调整策略。去年9月,Meta率先在英国重启公共帖子训练AI系统的尝试,而此次全面恢复欧盟市场的决策,则直接得益于欧洲数据保护委员会(EDPB)去年12月发布的法律意见。该意见明确支持Meta基于用户公开内容训练大型语言模型的做法符合监管要求,为这场持续近年的拉锯战画下阶段性句点。
在这场科技与监管的交锋中,我们大致已经可以读出欧盟在AI时代面临的困境与战略机遇。一方面,以GDPR为代表的严苛数据规则,既构成了科技企业拓展欧洲市场的准入门槛,也塑造了全球数字治理的重要参照系;另一方面,欧盟正试图在维护伦理标准与促进技术创新之间寻找平衡点,通过《人工智能法案》等监管框架,既避免技术失控风险,又为本土产业开辟竞争优势。
当高性能计算设施成为承载AI算力的战略基建,当地缘政治博弈延伸至算法底层架构,欧盟能否在数据主权、伦理准则与开放创新间构建有效协同,将决定其能否在智能革命中从规则接受者转型为议程塑造者。这场静默的技术竞赛背后,是监管智慧与战略定力的终极较量。
技术主权,不容有失
地缘政治的潮汐正以前所未有的速度重塑全球经济与科技版图,而欧美之间延续数十年的跨大西洋联盟正经历着微妙而深刻的重构。
随着“普爷”重返白宫,其"美国优先"的外交纲领与保护主义经济政策,如同投入全球化池塘的巨石,激起的涟漪已波及科技产业的每个神经末梢。
半导体供应链的中断、数据跨境流动的受阻、技术标准制定的博弈,这些具象化的政策冲击,正将欧洲推向战略自主的觉醒时刻。
在人工智能领域,这种觉醒表现为对技术主权的强烈诉求。巴黎峰会上的欧洲声音,无论是马克龙关于"欧洲AI模式"的疾呼,还是冯德莱恩对"基于规则的互联"的坚持,都在传递同一个信号:欧洲不愿成为中美科技竞赛的旁观者,更拒绝在技术伦理与监管标准上被强制同化。
这种诉求背后,是欧洲对自身文明特质的深刻认知——从GDPR对隐私权的绝对捍卫,到《人工智能法案》对高风险系统的严格管控,欧洲正在尝试构建一套区别于中美技术霸权的规则体系。正如拉加德在达沃斯所强调的,这种规则体系不仅是数字时代的伦理防线,更是吸引全球顶尖人才、培育本土冠军企业的战略磁石。
跨大西洋关系的微妙变化,在国防开支与科技标准两个维度上尤为凸显。北约东翼的军费争议,实质上是欧洲对美国安全承诺可信度的重新评估。当华盛顿的国防预算刀光剑影指向国内优先事项时,柏林、巴黎的防务白皮书正悄然改写安全依赖的叙事。而在科技治理领域,美国试图通过AI标准输出巩固其数字霸权,却与欧盟的监管哲学产生结构性矛盾。
这种矛盾在Meta数据争议中展露无遗:当美国企业习惯用"用户同意"的橡皮图章收集海量数据时,欧洲监管者正在重塑"知情同意"的法律边界。这种监管范式之争,本质上是两种数字文明——自由市场个人主义与社群主义——的碰撞,其结果将决定未来二十年的技术规则由谁制定。
在此背景下,技术主权被欧洲视为维护其文明特性的战略必选项。凭借雄厚的公共财政储备与跨成员国协作机制,欧盟已启动多项技术自主计划。法国主导的"Mistral AI"项目融合国际资本与本国战略投资,德国支持的Aleph Alpha与DeepL则展现了欧洲在核心技术突破上的多元路径探索。
尽管这些本土创新力量已在基础模型开发中取得进展,但相较于OpenAI的ChatGPT、谷歌的Gemini以及微软的Copilot等市场霸主,欧洲技术产品在商业化成熟度与生态整合能力上仍存在显著差距。
这种竞争态势既凸显了技术主权的紧迫性,也预示着欧洲需持续强化政策协同与资源投入,方能在全球科技博弈中真正掌握主动权。
去欧洲投资AI吗?
前段时间,欧盟冯德莱恩宣布了一项规模达2000亿欧元的"InvestAI"投资计划,彰显欧洲在人工智能领域确立全球领导地位的雄心。
该计划旨在通过前所未有的公私合作模式,整合成员国与跨国合作伙伴资源,共同构建欧洲版"AI巨型工厂"。
冯德莱恩强调,这一战略将借鉴欧洲核子研究组织(CERN)的成功经验,不仅支持科技巨头,更着力推动中小企业和学术机构平等获取先进算力资源,确保全欧洲科研力量能协同开发符合本土价值观的前沿大型AI模型,最终使欧洲蜕变为真正意义上的"AI大陆"。
计划核心在于打造"安全AI"的欧洲标准,要求AI系统从研发之初便内置无偏见、反歧视的设计原则,严格遵循数据保护法规完成训练过程,并通过欧盟特有的监管合规认证体系。
尽管欧洲着力打造的"伦理安全"开发路径被包装为差异化竞争优势,但市场端的实际接纳程度仍面临考验。当消费者在技术性能与价值观承诺之间做出抉择时,是否愿意主动选择那些虽符合本土监管标准但运算效率或功能表现略逊于美中标杆产品的欧洲AI解决方案,仍需通过真实消费场景下的用户选择来给出答案。
这种潜在的价值取舍矛盾,本质上折射出技术竞争力与伦理可信度在商业市场中的博弈关系——即便产品携带欧盟品质认证的光环,消费者是否愿意为道德承诺支付性能溢价,仍需由市场竞争给出最终裁决。
全球人工智能竞争的版图中,美国科技巨头长期占据技术制高点的现实不容忽视,而中国,由于deepseek的出现,其突破性的进展又为这场竞赛注入了新的变量。
同时,欧洲现阶段正通过战略重心转移开启人工智能领域的新博弈——冯德莱恩力推的AI投资计划不仅承载着技术追赶的雄心,更预示着全球半导体产业即将迎来需求端的重大变革。美国市场持续扩张的数据中心需求尚未降温,欧洲大陆已同步掀起人工智能基础设施的建设热潮,这种跨大西洋的算力竞赛正在催生高性能计算领域前所未有的发展机遇。
从规划蓝图到实体落地,从芯片供应到系统运维,整条技术产业链都将在欧洲新战略的推动下可能会获得强劲的增长动能。
面对覆盖四亿人口的统一市场及欧盟实际的经济基础,技术供应商们其实可以大胆一点,估算一下它所具备的巨大商业潜力。
不过,需要注意的是,地缘政治的寒流依旧在暗处涌动,持续升级的贸易关税争端也未曾搁置,这些因素是有可能会推高关键元器件的跨境流通成本,更将直接考验欧洲AI硬件供应链的韧性和监管的体系。
欧盟是怎么监管的?
欧盟在数字治理领域长期秉持严苛且系统化的监管逻辑,通过构建多层次的立法体系与强效执行机制来维护公民权益。其核心策略体现在以《通用数据保护条例》(GDPR)、《数字市场法案》(DMA)、《数字服务法案》(DSA)及《人工智能法案》(AI法案)为代表的法规集群中,这些法律文件不仅设立了全球最严密的数据保护标准,更通过高额处罚机制倒逼科技企业主动合规。例如GDPR中针对严重违规企业可处以全球营收4%的罚金,这种威慑性条款显著强化了欧盟监管框架的约束力。
社交网络领域的监管强化尤为引人注目。鉴于近年来多次出现通过算法操纵信息影响欧盟成员国选举的恶性事件,布鲁塞尔对平台透明度提出了更高要求。尽管相关调查报告未明确指向特定国家,但俄罗斯和中国等具备强大数字影响力的外部势力,其可能存在的信息干预行为已引起欧盟的高度警惕。这种安全焦虑进一步推动了AI法案中"可信技术"原则的深化。
《人工智能法案》作为欧盟抢占技术伦理制高点的标志性立法,构建起覆盖AI全生命周期的监管网络。该法案突破成员国间的法律壁垒,既要求高风险AI系统(如医疗诊断、自动驾驶等)在投放市场前必须完成可解释性测试,又强制部署方提供详尽的技术文档,包含算法逻辑、性能边界及风险预警等关键信息。
特别值得注意的是,法案在保障技术创新的弹性空间与守护公共安全底线之间取得了微妙平衡——既允许成员国根据国情制定差异化AI发展战略,又通过统一认证机制确保基本伦理标准不被突破。
这种"刚性约束与柔性治理"相结合的监管范式,正成为欧盟塑造全球AI规则话语权的重要工具。
所以,当技术企业竞相涌入这片新蓝海时,如何在效率优先与合规要求之间平衡,怎样在成本控制与供应链安全中抉择,就必然会成为比算法优化更复杂的战略命题。这场始于实验室的伦理技术革命,终究要在市场的风雨洗礼中验证其商业生命力。
说在最后
我们现在看到的,关于欧盟对高风险人工智能系统的监管不只是停留在法律文本层面,还通过全流程管理将伦理要求转化为可操作的标准。
这是好的一方面。
所有部署此类系统的实体必须构建必要的技术与管理保障措施,确保系统运行的合规性,并在正式投入使用前完成基本权利影响评估,精准识别潜在风险点及其作用群体。
为平衡创新与风控,各成员国被要求至少设立一个国家级AI监管沙盒,这种机制如同为前沿实验量身定制的"安全舱",使开发者能在真实市场压力之外,充分测试技术边界而不危及公众利益。
从战略维度观察,欧洲似乎正在通过监管沙盒这类创新工具,将严苛的合规要求转化为技术进化的催化剂。
那么我们可以假设一个情形(不过大概也难实现),当27个成员国以统一框架推进AI投资时,这种兼具原则性与灵活性的治理模式,势必会给全球AI竞赛的规则曲线带来极大的影响。
尽管地缘政治博弈、技术代际差距等挑战依然存在,但欧盟选择将数字主权议程与技术伦理叙事深度融合,这种战略选择,也可以看出欧洲所在的价值观的雄心,如果真的能成,完全可以在人工智能重塑全球权力结构的时代浪潮中,为欧洲大陆开辟出独特的竞争优势通道。
审校 | 童任
配图/封面来源 | 腾讯新闻图库
编辑/出品 | 东针-知识频道(未经允许,禁止转载)
欧洲的AI模式会走向何方?
2025年4月21日 -
3月10日,广东省人民政府办公厅印发广东省推动人工智能与机器人产业创新发展若干政策措施的通知,其中提出了,支持关键核心技术攻关、培育优质企业、打造应用场景等12项政策措施。具体内容如下:
广东省推动人工智能与机器人产业
创新发展若干政策措施
为深入贯彻落实国家发展人工智能与机器人产业的战略决策,按照省委“1310”具体部署,着力构筑高技术、高成长、大体量的产业新支柱,打造全球人工智能与机器人产业创新高地,制定本政策措施。
一、支持关键核心技术攻关。支持企业、高校、科研院所等各类创新主体开展联合攻关,围绕人工智能与机器人产业链上下游组建产业创新联盟,加快构建全过程创新链。组织实施省重点领域研发计划“新一代人工智能”“智能机器人”等旗舰项目、重大专项,在人工智能与机器人领域部署一批攻关任务。对国家科技重大专项符合省级配套条件的人工智能与机器人领域重点项目,省财政按规定给予配套奖励,单个项目省级配套金额超1亿元(含)的,按“一事一议”方式研究给予支持。创建人工智能与机器人领域制造业创新中心,对符合条件的国家级、省级制造业创新中心,省财政按规定分别给予最高5000万元、1000万元的资金支持。
二、培育优质企业。支持企业整合人工智能与机器人产业链、创新链资源,推动集聚发展,整体提升产业链协同创新能力。构建以单项冠军企业、专精特新中小企业为骨干的人工智能与机器人领域企业梯次培育体系。对该领域获评国家级单项冠军企业、专精特新“小巨人”企业,在落实省级支持政策的基础上,强化省市联动,鼓励地市给予奖励,省财政进一步按照地市奖励资金1∶1予以激励,调动地市积极性,对国家级单项冠军企业奖励总额度最高300万元,对国家级专精特新“小巨人”企业奖励总额度最高200万元。
三、打造应用场景。建立省级跨部门协调机制,压实“管行业管人工智能应用”责任,实施“人工智能+”行动,在教育、医疗、交通、民政、金融、安全等领域广泛拓展应用。组织开展“机器人+”行动,围绕工业、农业、城市管理、医疗、养老服务、特种作业等领域,深入挖掘开放应用场景。鼓励各地市挖掘开放各类应用场景,招引企业打造一批典型案例。
四、推动产业集聚发展。依托重点产业集群开展人工智能赋能新型工业化试点,对研发工业领域大模型和应用解决案例给予支持,每年择优支持不超过10个标杆案例,每个给予最高800万元奖励,推动制造业企业智能化转型。发挥各类人工智能与机器人创新联盟、协会等行业组织作用,促进产业链快速整合。发挥高校、科研院所优势,推动创新成果产业化。
五、支持重点项目建设。统筹省市资源对全省人工智能与机器人重点项目开通“绿色通道”,依法依规加快项目用地、环评、节能、用林等审批,省市联动保障固定资产投资额5000万元以上的先进制造业项目。
六、丰富数据要素供给。构建高质量人工智能数据集和语料库,形成一批高质量数据产品和服务。支持发展数据交易市场,推动广州、深圳数据交易所打造国家级数据交易场所。支持开展“数据要素×”行动,深化数据要素应用赋能。支持加快培育数据企业,依托优势打造广东数据要素集聚发展区。
七、完善人工智能与机器人开源创新生态。支持企业、高校、科研院所、行业协会通过技术协作,联合共建面向人工智能与机器人领域的开源社区、开源生态中心和相关公共服务平台,提供技术交流共享、生态推广培育、算力调度、开放性行业大数据训练库、标准测试数据集、大模型评测开放服务、测试验证等服务。每年择优支持不超过5个符合条件的开源社区和开源生态中心,按不超过其上一年度审定运营费用的30%,给予最高800万元资助。
八、引育高水平领军人才。围绕人工智能与机器人产业的发展需求和重点任务,支持企业引进培育一批具有突出技术创新能力、善于解决复杂工程技术问题的创新领军人才、青年拔尖人才。支持高校围绕人工智能与机器人领域开展高水平学科建设,进一步加强人才自主培育力度,加快打造人工智能与机器人产业人才大军。鼓励相关地市出台人工智能与机器人产业人才专项政策。
九、加强产业投融资。在省产业发展投资基金集群中设立人工智能与机器人产业基金,联合相关地市引导社会资本围绕人工智能与机器人产业链关键核心领域,着力投早、投小、投长期、投硬科技,创新基金管理机制,强化以尽职合规责任豁免为核心的容错机制。引导银行等金融机构为人工智能与机器人企业提供全生命周期的金融服务,丰富金融产品供给,加大对人工智能与机器人贷款贴息和风险补偿的政策支持力度。
十、推进标准体系建设。对于企业、科研院所围绕人工智能与机器人产业主导制定国际标准、国家标准、行业标准的,分别给予每项最高50万元、30万元、15万元的资助;对承担国际标准化组织技术委员会,全国、广东省专业标准化技术委员会秘书处的,分别给予每项最高100万元、30万元、10万元的资助。
十一、打造高端交流平台。举办“众创杯”人工智能与机器人专业创新创业大赛,在粤港澳大湾区博士博士后创新创业大赛、“创客中国”中小企业创新创业大赛暨“创客广东”大赛、“越来越好”国际设计大赛中设立人工智能与机器人有关专项赛。支持地市围绕人工智能与机器人高质量发展,打造具有国际影响力的学术会议、交流活动、创新创业大赛等活动。
十二、建立包容审慎监管机制。探索创新人工智能与机器人“监管沙盒”等包容审慎监管模式,营造鼓励创新、大胆试错的制度环境。加大财政资金对人工智能与机器人领域相关软课题研究的支持力度。完善生成式人工智能发展和管理机制,加快建设粤港澳大湾区生成式人工智能安全发展联合实验室。支持人工智能与机器人安全性相关的检测认证平台建设,提供安全风险、伦理道德等方面的评估认证服务。加快推动人工智能与机器人领域立法工作,为人工智能与机器人产业发展提供制度保障。
本政策措施有效期至2027年12月31日。
来源:广东省人民政府门户网站事关人工智能与机器人产业,广东最新发布!
2025年3月11日 -
作者 | 东叔(未经允许,禁止转载)
AI搜索赛道现在已经是刺刀见红的地步了,如果“AI巨头们”仍然拿不出比Deepseek更具颠覆性或比Open Ai 更具迭代化的技术和产品,则大概是要输掉这场由来已久的“搜索”战役。
但现在已经有参照物了——微信。
这可能是重塑整个“搜索”行业格局的一次合作。
微信搜一搜在调用混元大模型的基础上,正式灰度测试接入DeepSeek。
被选中的用户可在对话框顶部搜索入口看到“AI搜索”字样,点击进入后,可免费使用DeepSeek-R1满血版模型,享受更多元化的搜索服务。
在聊天界面顶部进入搜索栏,测试用户可选择“快速问答”或“深度思考”两个选项,进行AI搜索。腾讯方面透露,多个产品正在探索接入DeepSeek,以提供更丰富的体验和服务。
此次微信接入DeepSeek,被视为对行业生态有重要意义。
通过AI搜索,微信可整合公众号文章、视频号、小程序服务等内容,提升平台内部生态效率。同时,DeepSeek也将因此获得更大的流量入口,实现生态扩容。
工信部信息通信经济专家委员会委员盘和林认为,微信此举解决了DeepSeek当前算力不足的问题,并为其导入更多用户。
近段时间,DeepSeek因访问量过大常出现服务器繁忙,而微信则提供了一个替代方案,扩大了用户接触面,减轻了算力负担。
这看似是微信简单的功能升级,但实则是生态级资源的战略整合——微信依托其十亿级用户流量与全域内容生态(公众号、视频号、小程序),为DeepSeek注入超级入口;而后者则以"快速问答"与"深度思考"双模式精准切分用户需求,反向激活微信生态的内容服务效率。
除了日常应用这个功能之外,更值得我们去关注的是,这场合作直击了“搜索”行业的痛点:“搜索”是关于“人”的行为。
微信正好不缺“人”,也不缺“人的行为”。
甚至直接为算力吃紧的DeepSeek提供了分流方案,而DeepSeek则为腾讯系产品矩阵的智能化转型埋下关键伏笔。
当超级App与顶尖大模型深度耦合,一场关于流量、算力与场景的绝杀战役,已然拉开帷幕。
一、“搜索”的发展史
几十年前,互联网还只是一个由少数科学家和技术人员使用的、相对较小的网络。
到如今我们的生活与搜索引擎紧密相连,以至于很难想象如果像Google、百度、微软这样的搜索巨头突然消失,网络世界会变成什么样子?
从雅虎手工编织的网站黄页,到Google用PageRank算法将万维网转化为“超链接民主投票”,搜索引擎的进化史本质是一场算力与人类需求的赛跑。
1990年代初,当时互联网正处于萌芽阶段,由蒂姆·伯纳斯·李(Tim Berners-Lee)发明的“万维网”(World Wide Web)将世界各地的文档连接在一起。
最初的搜索引擎非常基础,主要依赖于人类策划的目录。
例如,雅虎就是从一个简单的网站目录开始的,它将网站按照主题分类,帮助用户找到所需的信息。这种方法在互联网规模较小、用户群体有限的情况下相当有效。
随着互联网的迅速扩张,人工目录的局限性逐渐显现。为了应对这一挑战,自动网络爬网技术应运而生。
1994年,WebCrawler成为最早提供全文搜索的网络爬网工具之一,这一技术革新极大地推动了在线搜索的发展——通过扫描整个网页并索引其内容,搜索引擎能够为用户提供更加全面和准确的搜索结果,于是,机器开始“吞噬”互联网。
在整个“搜索”的演变里,Google的出现是个无法跳脱的关键节点。
1998年,Larry Page和Sergey Brin在斯坦福大学期间开发的Pagerank算法彻底改变了搜索引擎的运作方式。
Pagerank不仅评估网页上的内容,还考虑链接到该页面的其他网页的质量,以确定其可靠性和相关性。这一算法受到了学术引用的启发,认为被其他高质量页面链接的页面通常更加重要和有用。
借助Pagerank,Google能够显著提高搜索结果的相关性和质量。这种利用万维网集体智能的方法使得网站管理员难以通过简单的页面优化(如关键字填充)来操纵搜索排名。
结合简洁且用户友好的界面,Google迅速崛起成为全球领先的搜索引擎,并通过不断更新算法和推出新产品来保持其统治地位,彻底颠覆了“关键词堆砌”的原始SEO逻辑。
进入千禧年,搜索引擎开始变得越加复杂,优化搜索结果以提高相关性和速度成为重点。用户现在可以在一秒钟内收到数百万个查询的结果,这导致我们对搜索引擎的依赖程度日益加深。
其中,最为经典的“10个蓝色链接”搜索引擎结果页面开始演变,为用户提供越来越多的信息……
此后二十年,搜索技术不断裂变:移动优先索引倒逼响应式设计普及,语音搜索迫使引擎理解自然语言,社交信号与个性化数据重塑排名规则——每一次技术跃迁都在重构信息权力的分配方式。
直至到现在,AI大模型的介入正将这场革命推向新高地。
当微信以十亿级流量入口接入DeepSeek,用“快速问答”与“深度思考”双模式重新定义搜索场景时,一个更深刻的范式转换已浮出水面:搜索不再只是“输入-索引-反馈”的工具,而是深度融合内容生态的智能中枢。
这既延续了Google用算法“驯化”互联网的野心,更在AI算力与超级App的联姻中,为互联网“搜索史”写下更具野心的一幕——从索引信息到驾驭生态,从服务用户到重构商业,或许,“搜索”的终极战场已转向“理解与创造”的维度。
二、巨头们曾引以为傲的突破
AI从根本上改变了搜索引擎能够处理的查询类型,使得用户能够提出更加复杂、细致的问题,并获得即时、综合的答案,而不再仅仅是一系列链接。这种全新的搜索体验,不仅让用户感到便捷,更在某种程度上令人上瘾。
以计划前往日本东京度假为例,我们可以向AI搜索引擎询问诸如“我下个月要去日本一周,住在东京,想进行一日游。附近有节日活动吗?有没有现场乐队演奏?”等问题。AI搜索引擎可以迅速整合当前信息,给出一个详尽且实用的答案,而非仅仅指向某个论坛或社交媒体的链接。
其实自2022年底ChatGPT横空出世以来,AI聊天机器人以其对话式交互和简洁明了的答案迅速赢得了用户的青睐。然而,ChatGPT在风靡一时的同时,也暴露出一个显著的短板——无法直接访问和提供最新的信息。为了弥补这一缺陷,AI驱动的搜索引擎应运而生,迅速填补了市场空白。
在ChatGPT推出后的短短几个月内,包括Google和Bing在内的传统搜索引擎巨头纷纷将生成式AI(Gen AI)技术融入其平台,以对话形式提供基于最新互联网信息的答案。与此同时,新兴公司如Perplexity等也积极投身AI搜索引擎领域,从头开始构建全新的搜索产品,与传统巨头展开竞争。
Google的BERT模型宣称“能理解人类长句的潜台词”、微软将GPT-4接入Bing声称要打造“对话式百科全书”、Meta用Llama重构社交搜索……
随着竞争的加剧,ChatGPT也推出了自己的网络浏览功能,使其能够充当搜索引擎的角色。
甚至最近OpenAI首席执行官Sam Altman还宣布,GPT 4o将要升智,智力要达到o3 pro水平,他还表示更新后的GPT 4o还是最好的AI搜索产品。
而中国就更多了,同样是基于原有的传统搜索引擎上融入了生成式AI技术,但略有不同的,是基于中文语义推出具有中国创新特色的搜索产品,以满足用户日益多样化的需求。
从这一方面看,中国AI搜索的爆发,始于对中文复杂性的驯服。
百度ERNIE 4.0通过引入知识增强算法,在成语隐喻、方言混用、网络新词等场景中实现精准意图识别。当用户询问“秋天的第一杯奶茶怎么薅羊毛”时,ERNIE不仅能解析“奶茶”指向饮品优惠而非畜牧业,还能关联美团、饿了么实时补贴数据生成攻略——这种“语义理解+即时服务”的能力,让Google的BERT在中文世界相形见绌。
阿里巴巴的通义千问则另辟蹊径,其多模态模型可同步解析淘宝直播片段、闲鱼商品图、菜鸟物流动态,将搜索从“文字问答”升级为“场景穿透”。
例如,用户拍摄一件模糊的汉服照片,系统不仅能识别形制年代,还能推荐杭州汉服租赁门店、抖音仿妆教程、拼多多同款配饰——这种跨平台的数据贯通,正是国际巨头难以企及的护城河。
这些“技术巨头们”纷纷以自身的技术代差筑起护城河,期望能够突破传统搜索技术和体量。这是他们引以为傲的“技术整合”和“算法迭代”,一度以为这是对搜索本质的重新定义,即:从“关键词匹配”到“意图解构”,从“信息索引”到“知识生成”,从“单向输出”到“多模态交互”。
根据一些报告,现在美国已有十分之一的互联网用户首选生成式AI进行在线搜索。其中,OpenAI的ChatGPT和Google的Gemini在AI搜索市场中占据了主导地位,两者合计捕获了全球AI搜索流量的78%。
紧随其后的是Perplexity和Microsoft的Bing,分别占据了16%的市场份额。随着这四大玩家几乎垄断了所有AI驱动的搜索请求,AI搜索市场的集中度越来越高。
AI搜索的崛起改变了我们的工作、生活方式,这是肯定的。据统计,单论美国,2023年就已有1300万人将生成的AI作为在线搜索的主要工具,预计到2027年这一数字将激增至9000万人以上,几乎占到该国人口的三分之一。
中国呢?据2024年《中国互联网络发展状况统计报告》数据显示,截至2024年12月,我国已有3.31亿人口表示对生成式人工智能产品有所耳闻,这一数字占据了全国总人口的23.5%。
其中,实际使用生成式人工智能产品的用户规模已经达到了2.49亿人,占全国总人口的17.7%。在这些用户中,利用生成式人工智能产品来回答问题的用户群体最为庞大,使用率高达77.6%。
另有近一半的用户将生成式人工智能产品视为办公助手,广泛应用于生成会议纪要、制作PPT等日常办公场景中。
但无论怎么看,有一个事实是,这些AI搜索引擎为用户提供的基本服务几近相似。
所以,当微信携DeepSeek以“全域内容蒸馏”杀入战场,基于“人的行为”出发去重构AI搜索的时候,这场“AI搜索战役”的规则正被杀穿——巨头们引以为傲的突破,开始暴露出致命的“人与内容”的生态脆弱性。
三、为什么微信+DeepSeek是杀招?
传统搜索巨头的生态霸权是建立在海量的数据+场景+服务的基础上的。例如,Google通过搜索入口绑定Gmail、文档、云存储;百度以搜索流量喂养百家号、知道、地图、外卖等。这是一种以自我为中心的闭环逻辑。
但当微信与DeepSeek的时候,这种逻辑会受到极大冲击。
微信将十亿用户的社交关系、朋友圈热词、小程序服务数据注入AI搜索,会直击这些“巨头们”的致命弱点,即封闭生态的数据孤岛。
DeepSeek-R1的“深度思考”,实际上是对微信全域内容(公众号长文、视频号片段、社群讨论)的实时蒸馏,而“巨头们”引以为傲的通用大模型,反而因缺乏场景化数据陷入“技术”的窠臼。
从这个角度看,这场AI搜索战役的进程,或许不再是算法优劣之争,而是生态协同效率的绝杀。
传统搜索引擎的底层逻辑是“信息索引”,而微信+DeepSeek的颠覆性在于“行为编译”+“拟人推理”。当Google通过Cookie追踪用户点击、Bing记录搜索历史时,微信早已构建了一个人类数字行为的全息图谱,什么意思呢?就是从用户行为获知的“人”的数据。
微信的恐怖之处在于其“生态融合能力”,例如:
- 朋友圈点赞暴露兴趣倾向,群聊关键词反映认知焦虑,交易暗藏消费偏好;
- 小程序预约记录重构时间管理逻辑,公众号“未读完”标记揭示知识吸收阈值,视频号中途退出率量化注意力耐久度;
- 同事群中的行业黑话、家庭群的养生谣言、校友群的创业动态——每个社交圈层都是天然的数据分类器、关系链。
DeepSeek-R1的杀招,正是将这些离散的行为碎片编译为“拟人化操作”。
当用户搜索“亲子露营攻略”时,系统不仅分析搜索词,更关联以下数据:
- 用户三天前在宝妈群讨论过“儿童防晒霜过敏”;
- 微信支付记录显示常订购山姆会员店的预制菜;
- 关注的户外公众号刚发布暴雨预警。
最终可能会生成的内容是——推荐低敏防晒品牌、支持卡式炉的露营地、以及可一键预约的帐篷配送服务。
这种AI搜索形式,直接从“满足需求”升级为“预判需要”。
像Bing,一般是基于大量数据下,搜索直接输出答案,看似提升了效率,实则从某种程度上隔断了内容生产者的流量。而Google的AI也曾因推荐“用胶水固定披萨奶酪”遭全网嘲讽,暴露大模型对UGC内容缺乏甄别力。
反观微信,通过绑定专业媒体公众号、企业服务号,依托社交圈层多样性(同事、亲友、兴趣群组),构建了“人机协同”的内容过滤网。
另一个方面,也能估计得出微信在AI搜索引擎中更具杀招意义的——信息碎片化的进阶。
移动互联网时代的信息碎片化曾被视作灾难,生产大量的碎片垃圾,但在微信+DeepSeek的框架下,以更深层次的应用下,碎片化将迎来价值逆转,例如:
- 朋友圈碎片的时空标定:一条“堵在高速”的抱怨,结合节假日、地理位置、用户车型数据,可反推出区域交通热力图;
- 群聊片段的语义蒸馏:宝妈群里的“某奶粉上火”讨论,经跨群话题聚类分析,能预警区域性育儿焦虑点;
- 小程序跳转的行为拼图:从“挂号助手”到“电影票务”的跳转路径,暴露用户决策链路的优先级排序。
微信的恐怖之处在于,它不试图对抗碎片化,而是将碎片重构成更精细的“认知颗粒度”。当用户搜索“如何缓解工作压力”时,DeepSeek-R1的答案可能包含:
- 根据用户每周日晚间的“周一恐惧症”朋友圈发布时间规律,推荐睡前冥想课程;
- 关联其最近三次医疗小程序访问记录中“颈椎病推拿”关键词,插入办公室拉伸视频;
- 调用企业微信中“连续加班审批记录”,触发EAP心理咨询绿色通道。
这种“碎片重组”彻底颠覆了传统搜索的“问题-答案”二元结构,形成“行为+需求+解决方案”的三维响应体系。
于是,AI搜索下,信息碎片不再是干扰噪声,而是会成为测绘用户认知地形的等高线。
四、微信+AI的生态可能性猜测
当搜索行为与人的数字生存深度耦合,我们可以对微信大胆做出几个猜测:
1. 搜索的无感渗透。例如:
- 场景预加载:深层需求和关系侧的需要不用再主动搜索;
- 社交链触发:例如三位好友搜索过“甲状腺结节”,系统自动生成定制化体检套餐推荐。
2. 服务颗粒重组。例如:
- 医疗搜索不再提供通用建议,而是根据用户医保类型、常去药店库存、家庭病史生成用药方案;
- 法律咨询答案将绑定小程序入口,实现从知识获取到法律行动的无缝跳转;
- 教育咨询会依据家长群聊中透露的学区房意向,推荐目标学校的校友导师资源。
3. 商业的流量重构。例如:
- 广告形态从“干扰式推送”进化为“需求应答”:“用户询问宠物托运攻略”直接触发携程宠物专车预约界面;
- 本地商家可通过分析周边用户群的“未满足搜索词”(如高频出现“深夜咖啡”但无匹配结果),逆向开设快闪店;
- 品牌私域不再依赖公众号推文,而是通过AI解析用户朋友圈美学偏好,动态生成千人千面的虚拟代言人形象。
微信+DeepSeek的真正颠覆性,在于将搜索从“工具”重构为“本能需要”——就像人类不会意识到自己在呼吸,未来的搜索将溶解于每一次聊天、支付、刷视频的日常动作中。这种转变带来两个深层变革:
- 权力转移:传统搜索引擎的“关键词霸权”被瓦解,取而代之的是基于行为熵减的“服务权威性”。谁能更精准地降低用户在数字世界的认知摩擦,谁就能掌握新的话语权。
- 伦理挑战:当AI比用户更早预知需求(例如通过生理数据推测抑郁症倾向并主动推送心理咨询),如何在“关怀”与“监控”间划界,将成为比技术突破更严峻的课题。
在这场革命中,微信正从社交工具蜕变为“13亿+用户的数字行为编译器”,而DeepSeek则是将编译代码转化为生存解决方案的运行时引擎。
当其他巨头还在优化答案质量时,微信已悄然开始重写搜索的底层操作系统——这或许才是AI搜索战争的终极形态。
本文作者 | 东叔
审校 | 王丛予、童任
头图来源 | 腾讯新闻库
编辑/出品 | 东针-知识频道(未经允许,禁止转载)
微信接入Deepseek,绝杀生猛的AI搜索
2025年2月19日 -
本文来自微信公众号:自主可控新事
蛇年前夕,AI 圈出了一个核弹级的消息:“国产AI之光”——deepseek 疯狂舞动刷屏,暴击美股,让整个硅谷坐立不安。DeepSeek 在1 月 20 日正式发布了一系列 DeepSeek-R1 模型,并上传 R1 系列的技术报告和各种信息。DeepSeek 此次共发布三组模型:
- DeepSeek-R1-Zero:大规模使用强化学习(RL)技术,没有任何监督微调(SFT);
- DeepSeek-R1:在强化学习前融入冷启动数据,多阶段训练;
- DeepSeek-R1-Distill 系列:DeepSeek-R1 中蒸馏推理能力到小型密集模型,参数规模分别为 1.5B、7B、8B、14B、32B 和 70B。
而在1月27日,DeepSeek在苹果App Store美国区免费应用下载榜上超越ChatGPT,排名第一,在中国区排行榜上同样登顶。而且DeepSeek的员工规模约140人,还不及 OpenAI的1/10。国产AI大模型DeepSeek犹如春雷炸响,正在以前所未有的影响力轰动全球科技圈。当前沐曦、天数智芯、摩尔线程、海光信息4家国产GPU企业,华为云、腾讯云、天翼云、阿里云、百度智能云、火山引擎6家国内云计算巨头,无问芯穹、硅基流动等AI基础设施企业,以及PPIO派欧云、云轴科技、青云科技等独立云厂商,均已宣布适配及上架DeepSeek模型服务。还有更多企业正在跟上。DeepSeek也成为本季度科技财报电话会议的必问话题,在今日刚刚举行的财报电话会议上,AMD董事长兼CEO苏姿丰、谷歌CEO桑达尔·皮查伊都对DeepSeek大加夸赞。昨日,天数智芯、摩尔线程、海光信息接连宣布完成与DeepSeek模型的国产化适配。加上周日率先宣布的沐曦,已有4家国产GPU企业公开拥抱DeepSeek。上周英伟达、AMD、英特尔等海外芯片巨头更是早早完成支持。
▲近期官宣支持DeepSeek模型的芯片企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)在今日财报电话会议上,AMD董事长兼CEO苏姿丰称赞DeepSeek展现了“AI世界创新的速度和步伐”、“模型和算法创新有利于AI普及”。她认为有新方法可以用更少的基础设施实现训练和推理能力,是好事,有助于在更广泛的应用领域部署AI计算,并夸开源模型的采用速度和步伐是相当惊人的。谷歌CEO桑达尔·皮查伊今日也在财报会议中夸DeepSeek是一支“了不起的团队”、“做得非常非常好”。他透露说,谷歌的Gemini 2.0 Flash模型和2.0 Flash Thinking模型在效率方面与DeepSeek R1相当。随着AI推理成本不断下降,AI将有更多用途,皮查伊认为这是谷歌的“机会空间”。继两大海外云巨头AWS和微软Azure后,这两天更多国内云计算巨头加入到支持行列中。阿里云、百度智能云、火山引擎先后官宣对DeepSeek V3、R1模型的支持。加之此前的华为云、天翼云、腾讯云,目前国内六大云巨头都已正式支持DeepSeek。
▲近期官宣支持DeepSeek模型的云服务及AI基础设施企业(按照时间顺序排列,信息来自各家官网、官方媒体平台)DeepSeek卷起的全球AI风暴,正在深度卷入产业中的每一位玩家,而中国芯片圈和云服务领域的巨头和创企们,已然集体出动。
01.国内GPU企业纷纷响应,美国芯片三巨头到齐
国内外芯片厂商纷纷快速响应,宣布对于DeepSeek模型的支持。海外芯片三巨头中,AMD响应最积极,早在1月25日新年前就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。在X平台发文中,AMD特别感谢了DeepSeek和SGLang团队的密切配合。
1月31日,AI计算“扛把子”英伟达也官宣其NVIDIA NIM微服务预览版对于DeepSeek-R1模型的支持。NIM微服务基于HGX H200系统,每秒能够处理3872个tokens。开发者们可以调用API进行测试和试验,该API后续会作为英伟达AI企业软件平台的一部分提供。
同样在1月31日,英特尔也宣布DeepSeek能够在搭载酷睿处理器的AI PC上离线使用。在酷睿Ultra 200H(Arrow Lake H)平台上,DeepSeek-R1-1.5B模型能够本地离线运行,做翻译、做会议纪要、进行文档撰写等任务。国内芯片厂商这边,华为的昇腾系列AI芯片自然不必多说。沐曦也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,2月2日首批上线的四个较小规模的模型(1.5B、7B、14B、32B),均部署在国产沐曦曦云GPU上。
▲沐曦模型资源包发布
DeepSeek-R1模型+沐曦曦云GPU+Gitee AI平台,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。官方称之为“100%国产AI的力量”。昨日,天数智芯、摩尔线程、海光信息接连宣布对DeepSeek模型的支持。天数智芯宣布与Gitee AI合作,仅用时一天,就完成了与DeepSeek-R1模型的适配工作,并已上线多个大模型服务,包括1.5B、7B、14B等版本。
▲天数智芯完成DeepSeek-R1模型适配,上线多个大模型服务
天数智芯写道,国内GPU与DeepSeek的适配可实现深度学习框架与国内自主硬件的深度融合,能促进国内AI产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,有助于国内GPU拓展市场,完善产业链生态。摩尔线程已实现对DeepSeek蒸馏模型推理服务的部署,并即将开放自主设计的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。
▲摩尔线程官宣信息
摩尔线程称DeepSeek的开源模型与摩尔线程的硬件形成闭环,验证了国产全功能GPU对复杂AI任务的支持能力,为AGI技术普惠化提供了可行路径。海光信息也在昨日宣布,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线。今日,海光信息技术团队再次宣布成功完成DeepSeek-Janus-Pro多模态大模型与海光DCU的适配优化,并正式上线。这是海光团队近期完成适配优化的第三款DeepSeek大模型,充分展现了DCU强大的生态优势与技术能力。DCU是海光信息推出的高性能GPGPU架构AI加速卡,已在多个领域规模化应用。用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,即可基于DCU平台快速部署和使用相关模型。
02.中国六大云巨头均已支持DeepSeek
2月1日大年初四,华为云正式官宣,经过和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。
▲硅基流动联合华为云上线的DeepSeek-R1/V3推理服务
华为云提到得益于自研推理加速引擎加持,双方支持部署的DeepSeek模型可以获得持平全球高端GPU部署模型的效果。同日,天翼云宣布上架DeepSeek-R1模型。天翼云智算产品体系(息壤-科研助手、天翼AI云电脑、魔乐社区、“息壤”智算平台、GPU云主机/裸金属)均接入DeepSeek R1模型并上线相应服务。
月2日,腾讯云官宣了对DeepSeek-R1模型的支持,在腾讯云的HAI平台上,开发者大约花3分钟就可以接入并调用模型。
2月3日下午16点58分,阿里云官宣其PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。
44分钟后,百度智能云也宣布了其千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,公布输入和输出价格,并从上线到2月18日24点模型限时免费。
昨日下午,字节跳动旗下火山引擎宣布将支持V3/R1等不同尺寸的DeepSeek开源模型,可以通过两种方式使用模型:一是在火山引擎机器学习平台veMLP中部署,二是在火山方舟中调用模型,将提供有竞争力的价格、全网最高限流、两周限时5折优惠,助力企业畅享满血版DeepSeek-R1。
同日,腾讯云TI平台宣布上架DeepSeek系列模型,包括“满血”的V3、R1原版模型和基于DeepSeek-R1蒸馏得到的系列模型,全面支持DeepSeek系列模型的一键部署,并限时开放了R1模型的免费在线体验。除了六大云巨头外,国内AI基础设施企业无问芯穹更是早在1月28日除夕一大早就宣布了其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。PPIO派欧、云轴科技则同在2月2日官宣对于DeepSeek模型的支持。PPIO派欧算力云支持了DeepSeek-V3、DeepSeek-R1、蒸馏模型DeepSeek-R1-Distill-Llama-70B,模型价格与官方价格保持一致。
云轴科技ZStack宣布AI Infra平台ZStack智塔支持企业私有化部署 DeepSeek V3/R1/Janus Pro三种模型,可基于海光、昇腾、英伟达、英特尔等国内外CPU/GPU适配。
海外市场,全球第一大云巨头AWS也在1月31日官宣DeepSeek-R1模型的全面上线。用户可在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart上部署DeepSeek-R1模型;在Amazon Bedrock上自定义导入DeepSeek-R1-Distill模型并在Amazon EC2 Trn1实例上部署DeepSeek-R1-Distill模型。
微软Azure云服务则是在1月30日宣布DeepSeek-R1正式上线微软的Azure AI Foundry以及GitHub。微软还贴心地给出了使用教程视频。
虽然DeepSeek的模型是开源的,但全球云服务厂商们对模型的支持仍然十分关键。通过支持DeepSeek模型的云平台,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等一系列繁琐步骤,直接在云服务厂商的平台上去调用DeepSeek模型。客观来说,像DeepSeek-V3这样的MoE模型总参数量有671B,部署门槛并不低。同时开发者还能在平台上以更少甚至零代码去实现从训练到部署再到推理的全过程,AI开发和应用的流程更简单、更高效。
DeepSeek朋友圈阵容豪华,合作共赢才是未来AI发展必由之路
DeepSeek给整个AI产业带来的影响是全方位、多层次的,除了自身模型的优秀,DeepSeek对于产业的带动效应更值得关注,从芯片产业到上层云服务产业,几乎所有头部玩家和创企都在积极涌入DeepSeek“生态圈”。有业内人士称,DeepSeek如此之快的爆发速度,一方面刺激着各路厂商加速适配模型,另一方面也刺激着算力产业的整合,随着模型同质化趋势凸显、开源模型的加速成长,AI应用生态层的商业价值会越来越高,应用层竞争也将成为后续行业聚焦的重点。DeepSeek无疑正在重塑全球AI产业的竞争版图,中美之间的AI竞争格局也在改变。算力神话被打破、更多玩家有机会在AI新时代更轻松地拿到“入场券”,AI应用生态的发展也愈发重要。正如DeepSeek创始人梁文锋近日在接受《暗涌》采访时提到的,在这波AI浪潮中,DeepSeek的出发点是走到技术前沿,去推动整个生态发展。正如英伟达的领先不只是一个公司到努力,也是整个西方技术社区和产业共同努力的结果,中国AI的发展,同样需要这样的生态。梁文锋说,DeepSeek希望形成一种生态,他们只负责基础模型和前沿的创新,其它公司在DeepSeek的基础上构建toB、toC的业务。中国知名生物学家、北京大学终身讲席教授饶毅近日发布了题为“鸦片战争以来,中国对人类最大的科技震撼:DeepSeek”的文章,激起广泛热议。毫无疑问,DeepSeek给海外诸多产业和领域都带来了巨大震撼,中美之间的AI竞争仍然事态焦灼、充满不确定性。中国AI或许正走在一个历史最关键时刻。正如傅聪所说:“我们不需要更多的禁令,中美作为在当今人工智能领域最领先的两个国家,不能不合作。只有共同合作发展,才能弥合数字和智能鸿沟,特别是帮助全球南方在人工智能发展进程中平等受益。”
四大国产GPU力挺DeepSeek!
2025年2月5日 -
本文来自微信公众号:APPSO,作者:appso,原文标题:《万字揭秘DeepSeek !这个创新让全世界疯狂复制,顶尖AI人才年薪千万,训练成本被低估》,题图来自:unsplash
这可能是迄今为止海外对 DeepSeek 最全面的一份分析报告,来自知名半导体研究机构 Semianalysis。
从 DeepSeek 让训练成本大幅降低的 MLA 模式,R1 和 o1 等模型的性能对比,人均年薪千万的顶尖人才,还指出目前 DeepSeek 的成本估算是错误的,推测其拥有大约 5 万块Hopper GPU……
关于 DeepSeek目前很多甚嚣尘上的传言,这篇文章依据现有信息给出了更客观的论述。
图灵奖得主杨立昆最近再次发表了关于 DeepSeek 的观点,他指出硅谷某些圈子的通病,是认定别处的创新都是靠作弊得来的。
而科技要快速进步,恰恰需要让更多人才参与并共享创新成果。在 DeepSeek 的开源模型上,我们也看到了这种愿景。
报告原文:
https://semianalysis.com/2025/01/31/deepseek-debates/APPSO 整理了这篇分析报告中的关键要点:
- 推测 DeepSeek 大约有5万块 Hopper GPU,在 GPU 上的投资总额超过 5 亿美元
- 广为讨论的 600 万美元成本仅指预训练过程中 GPU 的花费,这只是模型总成本的一部分。
- DeepSeek 团队目前约 150 人,从北大浙大等中国高校招聘人才,年薪可达千万
- 多头潜在注意力(MLA) 是 DeepSeek 大幅降低推理成本的关键创新,将每次查询所需的 KV 缓存减少了约 93.3%
- 在推理性能上 R1 与 o1 不相上下,而 o3 的能力明显高于 R1 和 o1
DeepSeek 风暴席卷全球
过去一周,DeepSeek 成为了全世界人们唯一热议的话题。
目前,DeepSeek 的日活(据悉超过 1900万)已经远高于 Claude、Perplexity 甚至 Gemini。
然而,对于长期关注 AI 行业的人,这个消息不算新鲜。我们已经讨论 DeepSeek 数月,对这家公司并不陌生,但疯狂的炒作却出乎意料。SemiAnalysis 一直认为 DeepSeek 极具才华,而美国更广泛的公众并不在意。
当世界终于关注到这家公司,其中狂热的舆论并没有完全反映它的真实情况。
我们想强调的是,舆论已经发生了转变。上个月,当 Scaling Laws (扩展定律)被打破时,我们就已揭穿了这个神话;如今,算法改进的速度过快,而这在某种程度上对英伟达和 GPU 不利。
现在大家讨论的是,DeepSeek 效率如此之高,以至于我们不再需要更多的计算资源,而由于模型的变革,出现了巨大的产能过剩。
虽然杰文斯悖论(Jevonʼs Paradox)也被过度炒作,但它更接近现实,因为这些模型已经引发了需求,对 H100 和 H200 的定价产生了实质性的影响。
编者注:杰文斯悖论简单来说就是,当某种资源的使用效率提高后,虽然单次使用时消耗更少,但因为成本降低、使用更方便,反而可能让人们用得更多,导致整体消耗量反而上升。
5 万块 Hopper GPU
幻方量化是一家中国对冲基金,也是最早在其交易算法中采用 AI 的先行者。他们早早就意识到 AI 在金融以外领域的潜力以及扩展能力的重要性,因此不断增加 GPU 的供应。
经过使用数千个 GPU 集群进行模型实验后,幻方量化在 2021 年,在任何出口限制出台之前,就投资了 10000 个 A100 GPU。
这笔投资得到了回报。随着幻方量化的不断进步,他们意识到是时候在 2023 年 5 月剥离出 “DeepSeek”,以更专注地追求进一步的 AI 能力。
当时由于外部投资者对 AI 缺乏兴趣(主要担心商业模式问题),幻方量化自筹资金成立了这家公司。如今,幻方量化与 DeepSeek 经常共享资源,包括人力和计算资源。
如今,DeepSeek 已经发展成为一项严肃且协同的重要项目,绝非很多媒体所称的“副业项目”。
我们相信即使考虑到出口管制因素,他们在 GPU 上的投资总额超过 5 亿美元。
我们认为,他们大约拥有 50000 个 Hopper GPU,但这并不等同于拥有 50000 个 H100 GPU。
英伟达根据不同法规要求推出了不同版本的 H100(例如 H800、H20),目前只有 H20 可供中国大模型公司使用。需要注意的是,H800 的计算能力与 H100 相同,但其网络带宽较低。
我们认为 DeepSeek 拥有大约 10000 个 H800 和大约 10000 个 H100。此外,他们还订购了更多的 H20,过去 9 个月内,英伟达已为中国市场生产了超过 1000000 个此类 GPU。
这些 GPU 在 幻方量化和 DeepSeek 之间共享,并在地理上有所分布。它们被用于交易、推理、训练和研究。
我们的分析显示,DeepSeek 的服务器资本支出总额约为 16 亿美元,其中与运营这些集群相关的成本高达 9.44 亿美元。
同样,由于资源集中化是一大挑战,所有 AI 实验室和超大规模云服务商都拥有比单次训练运行所使用的 GPU 数量要多得多,用于研究和训练的任务。
年薪近千万,在中国高校挖顶尖人才
DeepSeek 完全从中国招聘人才,不拘泥于以往的资历,而是高度重视能力与好奇心。DeepSeek 定期在北京大学、浙江等顶尖高校举办招聘活动,许多员工均毕业于这些院校。
岗位职责并完全固定,招聘时会有一定灵活性,招聘广告甚至宣称可以无限制调用 10000 多个 GPU。
这些职位竞争极为激烈,据称对有潜力的候选人提供的薪资超过 130 万美元(约合 934 万人民币),远高于中国大型科技公司和 AI 实验室(如 Moonshot)等竞争对手。
目前 DeepSeek 约有 150 名员工,但正在迅速扩张。
历史证明,一家资金充足且专注的小型初创公司往往能够突破界限。
DeepSeek 不具备像 Google 那样的官僚主义,由于其自筹资金,能够迅速推进新想法。
然而,与 Google 类似,DeepSeek(在大多数情况下)自建数据中心,而不依赖外部方或供应商。这为进一步实验提供了更大空间,使他们能够在整个技术栈上实现创新。
我们认为,他们是当今唯一最优秀的“开源权重”实验室,超越了 Meta 的 Llama 项目、Mistral 以及其他竞争者。
DeepSeek 的极低成本被误读了
DeepSeek 的价格与效率引发了硅谷科技圈地震的关键。
然而,关于 DeepSeek V3 的训练成本为 600 万美元这个广为流传的数字,其实是片面的。这相当于只关注产品物料清单中的某一部分,并将其视为全部成本。预训练成本仅仅是总成本中很小的一部分。
我们认为,预训练所支出的成本,远远不能代表模型所花费的总成本。
我们相信 DeepSeek 在硬件上的支出远超过 5 亿美元。他们为了开发新的架构创新,在模型开发过程中,花费了大量资金用于测试新思路、新架构和消融实验。
多头潜在注意力(Multi-Head Latent Attention) —— DeepSeek 的一项关键创新,耗时数月开发,花费了整个团队的大量人力和 GPU 计算时间。
论文中提到的 600 万美元成本仅指预训练过程中 GPU 的花费,这只是模型总成本的一部分。研发费用以及硬件本身的总体拥有成本等重要部分并未包含在内。
作为参考,Claude 3.5 Sonnet 的训练成本达数千万美元,如果那就是 Anthropic 的全部成本,那么他们就没必要从 Google 融资数十亿、从亚马逊融资数十亿美元。因为这是他们进行实验、提出新架构、收集和清洗数据、支付员工工资的必要成本。
那么,DeepSeek 是如何获得如此大规模的集群的呢?出口管制的滞后是关键,我们会在下文将详细讨论。
V3 让性能差距缩小的秘诀
毫无疑问,V3 是一款令人印象深刻的模型,但值得强调的是,它的“令人印象深刻”是相对于什么而言。
许多人将 V3 与 GPT-4o 进行比较,并强调 V3 在性能上超越了 4o,但 GPT-4o 是在 2024 年 5 月发布的。以当下 AI 的发展速度,算法改进方面那个时候和现在已是天壤之别。此外,我们并不惊讶在经过一定时间后,用更少的计算资源就能实现相当或更强的能力。
推理成本大幅下降正是 AI 改进的标志。
举个例子,一些可以在笔记本电脑上运行的小模型,其性能可与需要超级计算机训练,以及需要大量 GPU 推理的 GPT-3 相媲美。换句话说,算法改进使得用更少的计算资源即可训练和推理具备相同性能的模型,而这种模式在业内以及出现了多次。
这一次世界终于注意到了,是因为它来自中国的一家实验室,但小模型性能提升并不是什么新鲜事。
目前行业的趋势是,AI 实验室在投入的绝对资金上不断增加,以获取更高的智能水平。
据估算,算法效率每年进步 4 倍,即每过一年,用于达到相同性能的计算资源减少 4 倍。
Anthropic 的 CEO Dario 认为,算法进步甚至会更快,可以实现 10 倍的提升。
就 GPT-3 质量的推理价格而言,成本已经下降了 1200 倍。
在研究 GPT-4 的成本时,我们也看到了类似的下降趋势,尽管处于曲线的较早阶段。时间上的成本差异降低可以解释为不再像上图那样保持性能不变。
在这种情况下,我们看到算法改进和优化使得成本降低 10 倍,同时性能提升 10 倍。
需要说明的是,DeepSeek 的独特之处在于他们率先实现了这种成本和性能水平。
虽然 Mistral 和 Llama 模型也曾在开源模型上做过类似的事情,但 DeepSeek 做到的程度独树一帜。如果到了年底,成本再下降 5 倍,也请不要感到惊讶。
R1 凭什么迅速追上 OpenAI o1
大家热议的另一个话题,是 R1 能够达到与 o1 相当的效果,而 o1 仅在 9 月发布。
仅仅几个月时间,DeepSeek 是如何如此迅速地赶上的呢?
问题的关键在于,推理能力形成了一种全新的范式。
推理范式迭代速度更快,且以较少的计算资源即可获得显著收益。正如我们在扩展定律报告中提到的,以往的范式依赖于预训练,而这种方式不仅成本越来越高,且已经难以取得稳健的进步。
新的推理范式,专注于通过合成数据生成和在现有模型上进行后训练中的强化学习来提升推理能力,从而以更低的成本实现更快的进步。
较低的入门门槛加上易于优化,使得 DeepSeek 能够比过去更快地复制 o1 方法。随着各方探索如何在这一新范式下进一步扩展,我们预计不同模型在匹配性能的时间差距将会拉大。
需要注意的是,R1 论文中没有提及所使用的计算资源。这绝非偶然 —— 为了生成用于后训练的合成数据,R1 需要大量的计算资源,更不用说强化学习了。
R1 是一款非常优秀的模型,但它披露的一些基准测试也具有误导性。R1 特意没有提及那些它并不领先的基准测试,虽然在推理性能上 R1 与 o1 不相上下,但在每项指标上它并不都是明显的赢家,在许多情况下甚至不如 o1。
这里我们还没有提到 o3。o3 的能力明显高于 R1 和 o1。实际上,OpenAI 最近分享了 o3 的结果(还提前发布了 o3-mini ),其基准测试的扩展呈垂直趋势。
这似乎再次证明了“深度学习遭遇瓶颈”,但这个瓶颈不同以往。
与 Google 的推理模型不相上下
尽管 R1 的炒作热潮不断,但很多人忽略了,一家市值 2.5 万亿美元的美国公司在上个月以更低的价格发布了一款推理模型:Google 的 Gemini Flash 2.0 Thinking。
该模型已经可以使用,并且通过 API 即使拥有更长的上下文长度,其成本仍远低于 R1。
在已公布的基准测试中,Flash 2.0 Thinking 超越了 R1,尽管基准测试并不能说明全部情况。Google 只发布了 3 个基准测试,因此情况不够全面。不过,我们认为 Google 的模型非常稳健,在许多方面可以与 R1 相当,但却未获得太多关注。
这可能是由于 Google 营销策略平平、用户体验较差,但同时 R1 也作为一项来自中国的黑马出现。
需要明确的是,这些都不会削弱 DeepSeek 非凡成就的价值。DeepSeek 作为一家快速运作、资金充足、聪明且专注的初创公司,这正是它在推理模型方面超越 Meta 等巨头的原因。
让美国科技圈疯狂复制的 MLA 创新
DeepSeek 实现了许多领先的 AI 公司都未达到的技术创新。我们预计,接下来 DeepSeek 发布的任何技术进展,都将几乎立刻被西方实验室复制。
这些技术突破是什么?大多数架构上的成就都与 V3 相关,而 V3 也是 R1 的基础模型。下面让我们详细介绍这些创新。
训练(预训练与后训练)
DeepSeek V3 利用 Multi-Token Prediction (MTP) 实现了前所未见的规模,这是一种新增的注意力模块,可预测接下来的多个 token,而非单一 token。
它在训练过程中显著提高了模型性能,并且在推理时可以被移除。这就是一种利用较低计算资源实现性能提升的算法创新。
还有一些额外的考量,比如在训练中采用 FP8 精度,但领先的美国实验室已经使用 FP8 训练有一段时间了。
DeepSeek V3 还是一种专家混合模型,即由众多专注于不同任务的小专家组成的大模型,表现出强大的涌现能力。
MoE 模型曾面临的一个难题,是如何确定哪个 token 应该分配给哪个子模型或“专家”。DeepSeek 实现了一个“门控网络”(gating network),能以平衡的方式将 token 路由到合适的专家,而不会影响模型性能。
这意味着路由效率非常高,在训练过程中每个 token 相对于整个模型的规模仅需修改少量参数。
这提高了训练效率,同时也降低了推理成本。
尽管有人担心专家混合模型(MoE)带来的效率提升,可能会减少投资,但 Dario 指出,更强大 AI 模型所带来的经济效益非常可观,因此任何节约的成本都会迅速再投资于构建更大规模的模型。
MoE 的效率提升不仅没有减少总体投资,反而会加速 AI 的规模扩大。目前硅谷的主流科技公司都在正全力以赴地将模型扩展到更多计算资源,并在算法上提高效率。
R1 背后的基础模型 V3
就 R1 而言,其极大地受益于拥有一个强大的基础模型(V3),这部分得益于强化学习(RL)。
RL 主要聚焦两个点:格式化(以确保输出连贯)以及有用性和安全性(以确保模型实用)。
推理能力是在对模型进行合成数据微调时产生的。正如我们在扩展定律文章中提到的,这正是 o1 所经历的过程。
需要注意的是,R1 论文中没有提及计算资源的使用情况,这是因为提到所用计算资源的数量会透露他们拥有的 GPU 数量远超过其对外宣传的规模。
如此大规模的强化学习需要大量计算资源,尤其是在生成合成数据的场景。
此外,DeepSeek 使用的一部分数据似乎来自 OpenAI 的模型(尚未证实),我们认为这将对从输出中进行蒸馏的政策产生影响。根据服务条款这是违规的,但未来一种新的趋势可能会采取类似 KYC(了解你的客户)的方式来阻止数据蒸馏。
谈到蒸馏,也许 R1 论文中最值得关注的部分,是能够通过用推理模型的输出对非推理小模型进行微调,将其转变为具备推理能力的模型。
数据集策划共包含 80 万个样本,现在任何人都可以利用 R1 的思维链(CoT)输出创建自己的数据集,并借助这些输出构建推理模型。
我们可能会看到更多小模型展示出推理能力,从而提升小模型的性能。
多头潜在注意力(MLA)
正如我们在前文提到,多头潜在注意力(MLA) 是 DeepSeek 在推理成本上大幅降低的关键创新。
因为与标准注意力机制相比,MLA 将每次查询所需的 KV 缓存减少了约 93.3%。KV 缓存是 Transformer 模型中的一种内存机制,用于暂时保存代表对话上下文的数据,从而减少重复计算。
随着对话上下文的增长,KV 缓存也会增加,进而带来巨大的内存压力。因此大幅减少每次查询所需的 KV 缓存,就能降低每次查询所需的硬件量,从而降低了整体成本。
不过我们认为 DeepSeek 是以成本价提供推理服务以抢占市场份额,而并非真正盈利。
Google Gemini Flash 2.0 Thinking 仍然更便宜,且 Google 不太可能以成本价提供该服务。MLA 尤其引起了许多领先的美国实验室的关注。
MLA 于 2024 年 5 月在 DeepSeek V2 中首次发布,由于 H20 的内存带宽和容量相比 H100 更高,DeepSeek 在推理工作负载上也获得了更多效率提升。他们还宣布与华为建立合作关系,但迄今为止在昇腾计算方面的应用还很少。
(前天硅基流动和华为云团队宣布联合首发并上线基于华为云昇腾云服务的 DeepSeekR1/V3 推理服务。)
我们认为,MLA 对利润率带来的影响,对整个 AI 生态系统都意义重大。
R1 没有在技术层面削弱 o1 的优势
在利润率方面,我们有一个关键发现:R1 并未削弱 o1 在技术上的优势,反而以更低的成本提供了相似的能力。
这一结果合理且具有启示意义,促使我们构建了一个面向未来的定价机制框架。能力越强,利润率越高,这一逻辑与半导体制造行业的发展路径颇为相似。
当台积电首次突破至新的工艺节点,推出前所未有的产品时,便能获得强大的定价权。而处于技术追赶阶段的竞争者,如三星和英特尔,则更多依靠在成本和性能之间寻求平衡,通常以低于市场领导者的价格进行竞争。
对于芯片制造商(在这里可类比为 AI 实验室)而言,优势在于可以灵活调整产能。如果某个新模型具备更优的成本效益,企业可以快速增加其产能,同时逐步减少对旧模型的支持。
这种产能调整机制不仅符合当前 AI 实验室的运作模式,也与半导体行业长期以来的经验契合。
技术的竞争就是定价权争夺
这或许预示着未来 AI 竞赛的发展轨迹。
率先进入新能力层级的企业将掌握显著的定价溢价,而跟随者则只能依靠微薄的利润勉强维持。
那些在能力上落后的产品仍会存在,前提是它们能满足特定的使用场景,但每一代产品中能够赶超领先者的参与者会越来越少。
我们已经在见证,R1 已经达到了领先的能力水平,却以零利润的价格销售。
这种鲜明的价格差异引发人们的疑问:凭什么 OpenAI 的产品这么昂贵?因为他们的产品定价基于最前沿的技术,并从中获取相应的溢价收益。
我们认为,未来的技术发展速度将超过半导体制造业目前的快速节奏。
追求最新能力意味着持续的定价权——以ChatGPT Pro为例,而能力滞后的产品则必须通过降低价格来维持市场,利润主要依赖于底层的算力和代币基础设施。
在当前这个快速迭代的技术周期中,追求卓越能力的动力只会加速产品的更新换代。只要企业能够持续拓展能力、开发具有新价值的功能,就理应享有定价权;反之,在开放市场中,产品同质化的趋势会迅速显现。
在这个背景下,人们对当前局势存在着根本性的误解。我们所描述的情景,颇有几分类似于超高速发展的半导体制造业——这是全球资本密集度最高的行业。没有哪个行业在研发上的投入超过半导体制造业,但最接近这一现实的AI模型供应链,却常常被视为不利的参照对象。
将 AI token与杰文斯悖论进行比较,可以发现深刻的历史相似性。
最初,人们对晶体管能否持续微缩存在疑虑;一旦这一趋势被确认,整个行业便全力以赴推动 CMOS 技术向极限缩放,并在此基础上构建关键功能。
如今,我们正处于将多链思维模型和能力整合的初期阶段,这与晶体管微缩的早期时代颇为相似。尽管从技术角度来看,这可能是一个充满动荡的时期,但对于英伟达而言却是一个好消息。
免费又强大推理模型能一直持续吗
事实上市场一直在寻找一种新的破局点,而这正是它所选择的。
如果 DeepSeek 愿意以 0 或甚至负利润率运营,那么其产品价格确实可能被压低到如此程度。
然而,对于前沿 Token 服务的定价弹性显然要高得多。鉴于 DeepSeek 正处于新一轮融资之中,他们有强烈的动力去追求这一策略。
在推理领域的一个关键转折点上,DeepSeek 打破了 OpenAI 占主导地位的利润率。这种领先地位能否持续?
我们认为不会——毕竟,一个开源实验室现在已经展示了曾被认为仅属于闭源实验室的能力。虽然这是一个关键性的发展,但必须认识到 DeepSeek 仍然是一个快速跟随者。
我们确实认为,一个更强大的开放实验室(目前 DeepSeek 是最杰出的代表),将极大地惠及新兴云服务提供商和基础设施供应商。
无论模型是开源还是闭源,计算资源的集中化依然至关重要。然而,如果建立在这些计算资源之上的上层服务开始免费提供产品,那么计算本身的内在价值很可能会上升。
更多资本将流向计算基础设施,而不是封闭模型供应商,这标志着支出正向硬件转移。软件公司也将从这一动态中大幅受益。
本文来自微信公众号:APPSO,作者:appso
万字揭秘DeepSeek:顶尖AI人才年薪千万,训练成本被低估
2025年2月5日 -
几乎是一夜之间,“来自东方的神秘力量”又一次击中海外人士心脏。
近两日,国产AI黑马DeepSeek(深度求索)在全球科技界刷屏。新模型发布后的访问量激增,一度让DeepSeek闪崩,但问题在数分钟内得到解决。AI界上一次出现宕机情况,还是月之暗面的Kimi出圈爆火之时。
截至发稿,DeepSeek在美区苹果App Store的免费排行榜中飙升至第二,第一是ChatGPT。
▍与OpenAI“掰手腕”
DeepSeek本次“刷屏”,起因是1月20日其正式发布推理大模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现,能与OpenAI的最强推理模型o1“掰手腕”,但其API调用成本却低了90%-95%。
DeepSeek-R1的惊艳表现,先是引发了海外市场的强烈关注。在美国,多位AI行业的资深专家和从业者盛赞DeepSeek-R1。
美国计算机科学家、萨姆·奥尔特曼的导师吴恩达在第55届世界经济论坛(冬季达沃斯)上点赞DeepSeek——“我对 DeepSeek 的进展印象深刻。我认为他们能够以非常经济的方式训练模型。他们最新发布的推理模型,非常出色……‘加油’!”。
微软CEO萨蒂亚·纳德拉也公开表示,“他们(DeepSeek)切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”纳德拉还强调,“我们必须非常、非常认真地对待中国的这些进展”。
DeepSeek成立于2023年5月,其背后是国内对冲基金巨头幻方量化。
2023年11月2日,DeeSeek推出首个模型DeepSeek Coder,该模型免费供商业使用且完全开源。2023年11月29日,DeepSeek LLM上线,其参数规模达到 67B,性能接近 GPT-4,同时还发布了该模型的聊天版本 DeepSeek Chat。
真正让Deepseek在AI界出圈的,是其在2024年5月开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一,DeepSeek由此被称作“价格屠夫”、“AI界的拼多多”。
随后的2024年下半年,这家公司还先后发布了DeepSeek R1-lite-preview和DeepSeek-V3。
到了2025年推出的R1模型,在数学能力测试中,该模型在MATH基准测试上达到了77.5%的准确率,与OpenAI的o1不相上下;在编程领域,R1在Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。
而这一切,是在不到600万美元的投入和2048块低性能的H800芯片的条件下完成的,训练时间仅用两个月。这种“四两拨千斤”的模式,颠覆了人们对OpenAI“大力出奇迹”式的固有认知,结果令全球侧目。
- DeepSeek曾导致微软股价出现波动
1月30日,微软公司首席执行官萨提亚·纳德拉(Satya Nadella)对国产人工智能大模型公司DeepSeek表达了积极评价。本周早些时候,DeepSeek曾导致微软股价出现波动。
这家新兴企业凭借其开源AI模型R1震惊了美国科技行业。DeepSeek声称,该模型在性能上可与西方同类模型媲美甚至超越,但成本仅为其一小部分。
微软首席执行官萨提亚·纳德拉(Satya Nadella)在周三微软公布季度财报后的投资者电话会议上表示:“DeepSeek确实带来了一些真正的创新。显然,现在所有这些都会被商品化,并广泛应用。”
DeepSeek的突破让投资者开始思考,微软是否真的需要在AI基础设施上投入如此巨额的资金。微软和其合作伙伴OpenAI是否可以用更低的成本训练AI模型并处理用户查询(即推理过程)?
对此,纳德拉表示,他们已经在这样做了。
纳德拉称,“我们自己在训练和推理方面多年来一直在实现显著的效率提升”。微软利用自身软件优化AI模型和AI硬件的每一代升级,以提高性能并降低成本。
纳德拉指出,微软的许多工作是与OpenAI合作完成的。他补充说,光是发布最先进的模型还不够,关键是要让其具备成本效益。如果运行成本太高,那就毫无意义。
尽管如此,微软仍计划在本财年投入800亿美元建设数据中心,以满足客户对其AI产品的需求。不过,公司预计从2026财年(7月1日开始)起,这部分支出的增长将逐渐放缓。
此外,周三,微软宣布已将DeepSeek的R1模型添加到其Azure AI Foundry平台,该平台包含超过1800个AI模型,供企业用于设计和管理AI程序。
当地时间1月29日,微软公布截至2024年12月31日的2025财年第二财季业绩,财报发布后,微软盘后股价跌超4%。
- 中国AI新创DeepSeek挑战美国优势,白宫警钟:领先仅3-6个月
中国新创公司深度求索(DeepSeek)的生成式人工智能(AI)模型引发全球关注。据白宫AI与加密货币负责人塞克斯28日表示,尽管美国在AI领域仍然处于主导地位,但其领先中国的优势仅剩3至6个月。他警告,美国公司过去可能过于自满。塞克斯在接受福斯新闻采访时表示,DeepSeek的生成式AI可以与美国人工智能研究室OpenAI开发的ChatGPT媲美。
尽管OpenAI正在开发下一代模型,但其领先优势只有3至6个月。此消息引发了外界对美国在AI领域优势的质疑,导致AI芯片大厂NVIDIA等科技股票在27日重挫。美国总统特朗普也表示,DeepSeek对美国企业来说是一个警钟。尽管如此,白宫发言人李威特表示,特朗普相信美国能够重新夺回AI领域的主导地位。在特朗普的支持下,OpenAI、软银和甲骨文的合资企业Stargate正在全美范围内建设数据中心,总投资达到5000亿美元。然而,DeepSeek声称他们能够以较不先进、较少的芯片训练强大的AI模型,这使得人们质疑美国是否在AI建设上投入过多。
对此,塞克斯指出,美国禁止高阶芯片出口到中国,因此中国必须充分利用他们能够获得的芯片,提高芯片的效能。他认为,美国的出口限制成为了中国创新的动力。同时,塞克斯也指出,美国必须赢得AI竞赛。他批评美国的AI公司过去可能过于自满,没有意识到中国的AI公司与他们的差距其实并不大。他还批评前总统拜登对AI发展提出过多的管制措施,束缚了美国AI公司的发展。他认为,DeepSeek的发展证明了特朗普推翻拜登时代的管制措施是正确的。
DeepSeek低成本AI模型震惊全球科技圈!美韩破防
2025年2月5日 -
2022年,中国经历了一个历史性的转折点,死亡人数首次超越了出生人数,这一现象是1961年以来首次出现。
据统计,该年度我国全年出生人口为956万人,人口出生率为6.77‰;死亡人口为1041万人,人口死亡率为7.37‰;人口自然增长率为-0.60‰,而2019年到2021年,全国人口自然增长率分别是3.34‰、1.45‰、0.34‰。,标志着中国人口动态发生了根本性变化。
多年来,人口学家和社会观察家们一直预警着即将到来的人口危机。
截至2023年底,中国60周岁及以上老年人口已达29697万人,占总人口的21.1%。65岁及以上人口数已经达到22676万人,人口占比达到了总人口16.4%。
中国社会已经进入中度老龄化阶段,老龄化程度还在不断加深,老年人口数量的增加导致了养老、医疗、保健等需求的大幅增长。
虽然2024年的具体老龄化数据尚未完全公布,但根据已有趋势和预测模型,可以预见老年人口数量将继续增长,占总人口的比例也将有所上升。
随着出生率的持续下滑,加之人口结构迅速老龄化,中国的人口规模和构成正经历深刻变革。这一趋势不仅影响了国家的发展蓝图,也对社会经济结构产生了深远影响。
面对这一新常态,中国经济不可避免地将面临劳动力资源缩减的挑战。
随着老年人口比例的不断攀升,年轻一代对老年人福利的依赖也将日益加重。这无疑将给社会福利体系和养老金制度带来前所未有的压力。
数据所揭示的人口动态,预示着中国正步入一个前所未有的危机时期。这一危机不仅关乎人口数量的平衡,更触及到社会保障、经济发展乃至社会稳定等多个层面,需要政府、社会和个人共同努力,寻求创新和可持续的解决方案。
人口结构危机的根源
在全球范围内,人口结构的变化是一个复杂而多维的现象,其根源往往深植于经济发展、社会变迁以及政策导向之中。
中国,作为世界上人口最多的国家,其人口结构的变化尤为引人注目,且在一定程度上反映了全球人口发展的普遍规律与独特挑战。
从全球视角来看,随着国家经济的发展和人均收入的提升,生育率普遍呈现下降趋势,这是一个被广泛观察到的现象。
经济学原理和社会学理论均指出,随着生活水平的提高,家庭对于子女数量的需求减少,转而追求更高质量的生活和教育。
同时,医疗技术的进步和公共卫生条件的改善使得人均寿命显著延长,进一步加剧了人口老龄化的问题。
中国的情况也不例外,国家卫生部门的预测显示,到2035年,中国65岁及以上人口的比例将从当前的不到20%攀升至30%以上,这一趋势与全球老龄化的大潮相呼应。
但中国的人口结构危机并非仅仅由这一全球共性因素所驱动,其独特性在于独生子女政策的深远影响。这一政策,自20世纪70年代末至80年代初提出,并随后开始实施的,旨在应对当时中国快速的人口增长对经济和社会福利体系造成的压力。
通过限制绝大多数家庭只生育一个孩子,我们政府试图控制人口规模,减轻资源环境压力,促进经济发展。该政策的执行手段包括限制避孕药具的获取、实施经济制裁,以及在极端情况下采取强制绝育和堕胎等措施,这些手段在当时引发了广泛的社会争议和深刻的家庭变革。
独生子女政策及其营造的恐惧文化,确实达到了降低生育率的预期效果。在政策实施期间,中国的生育率从1980年的每名妇女生育2.74个孩子迅速下降至2016年的1.77个孩子。
1980年,中国总和生育率为2.74,较70年代的4.01有显著下降。这一年,中国开始实行独生子女政策,以应对严峻的人口形势。城乡生育率存在明显差异,城市为1.33,农村为2.84。
这一政策带来了前所未有的社会挑战,包括性别比例失衡、家庭结构变化、养老负担加重等问题。
更为严重的是,它塑造了一种不愿生育的文化氛围,即使在政策调整后,这种文化惯性依然难以扭转。
尽管我们政府自2016年起逐步放宽生育限制,推出“全面二孩政策”,乃至2021年的“三胎政策”,并配套实施了一系列财政激励措施,但生育率的回升并不明显。2022年,中国的生育率进一步下降至每名妇女生育1.18个孩子,远低于维持人口自然增长所需的2.1的替代率。
这一数据表明,尽管政策层面做出了努力,但长期形成的生育观念和文化障碍仍然难以克服,加之城市化进程加速、教育成本上升、职场竞争激烈等多重因素,使得年轻家庭对于生育持更加谨慎的态度。
此外,独生子女政策还加剧了中国的老龄化问题。由于一代人中的大部分家庭只有一个孩子,当这一代人步入老年时,他们将面临更加严峻的养老挑战。传统的家庭养老模式难以为继,而社会养老体系的建设和完善尚需时日,这使得老龄化问题成为中国经济社会发展的一大隐忧。
人口结构失衡的灾难
现在我们正面临一场由长达四十年新生儿短缺与老年退休人员激增所引发的“风暴”。这场风暴正在深刻地改变着我们的年龄结构,使其日益向老年人口倾斜。
据预测,到2050年,我们的劳动年龄人口数量将显著减少约2.6亿,这一趋势将对我们的劳动力市场和经济增长产生深远的影响。
我们的抚养比,即非劳动年龄人口(包括0至14岁的儿童和65岁及以上的老年人)与劳动年龄人口的比率,正在迅速上升。从2021年的45%到2055年,这一比率预计将超过76%,远高于同期全球平均水平的61%。
这种年龄结构的转变不仅意味着每个劳动年龄人口需要支持更多的非劳动年龄人口,也预示着我们社会将面临前所未有的养老和医疗压力。
老龄化与劳动力供应减少之间存在着密切的关联。随着年龄的增长,老年人的劳动力参与率逐渐降低,同时他们的生产力也可能受到影响。
这意味着,随着老年人口的增加,我们的劳动力市场将面临更大的挑战。年轻员工可能需要花费更多的时间和金钱来照顾年迈的家庭成员,这将进一步加剧劳动力短缺的问题。
此外,人口老龄化还意味着医疗保健支出在国内生产总值中所占的比例将不断攀升。
随着老年人口的增加,对医疗服务的需求也将随之增加,这将给我们的医疗保障体系带来更大的压力。为了应对这一挑战,我们政府需要加大在医疗保健领域的投入,提高医疗服务的质量和效率,以满足老年人口的需求。
更为紧迫的是养老基金的压力。
我们的养老基金主要依赖于年轻工人的缴款来支付当前退休人员的费用。
随着劳动力数量的减少和退休人数的增加,养老基金将面临更大的资金缺口。据预测,我们的国家养老基金可能在2035年耗尽。
这必然将直接影响到老年人的生活水平。
为了应对养老金和医疗保健危机,我们政府可能不得不采取一系列艰难的措施。
这可能包括降低老年人的生活水平、提高企业或个人的税收、减少其他领域的政府支出等。
但每一项措施都可能对经济增长构成威胁。
降低老年人生活水平将影响社会稳定和民众福祉;提高企业或个人税收可能抑制消费和投资;减少政府支出则可能削弱公共服务的质量和覆盖面。
劳动力的后继乏力也会成为制约我们经济增长的重要因素。
据世界经济论坛预测,未来十年我们每年将面临约1180万人的劳动力短缺。虽然这一缺口部分是由于教育和技能短缺造成的,但更主要的原因还是出生率的下降。
这意味着,我们过去依靠低成本生产和丰富劳动力推动的经济增长模式将面临人不够用或无人可用的现实。
国际货币基金组织预计,2027年后我们的经济增长将继续放缓至平均3%左右,远低于过去的增长轨迹。
这种缓慢的增长轨迹将对我们的生活水平和全球经济增长产生深远的影响。作为全球最大的发展中国家之一,我们的经济增长一直是推动全球经济复苏和增长的重要力量。
现在,随着人口老龄化和劳动力短缺的加剧,我们经济增长的放缓将对全球经济格局产生重大的影响。
机器人:应对银发危机的关键?
振兴劳动力、维持经济增长成为我国当前一个急需解决的难题。
然而,移民政策的限制、出生率的持续低迷以及退休年龄调整的有限影响,都使得解决这一问题的道路充满了各式各样的阻滞。
在这样的背景下,机器人自动化作为一种潜在的解决方案,便开始受到越来越多的关注。
长期以来,西方社会对于机器人自动化的态度往往充满了担忧,担心它们会抢走人类的工作,导致失业率的上升。
但在我们国家,随着人口老龄化的加剧和劳动力短缺的日益严重,机器人自动化或许能够成为重塑我们国家经济前景的关键力量。
这些技术,从工业生产线上的自动化机器人到能够处理复杂任务的人工智能系统,正在逐渐改变着人类的工作方式,使得企业能够在劳动力短缺的情况下,依然保持高效的生产能力。
在制造业领域,机器人自动化的应用尤为广泛。随着中年生产工人的稀缺和劳动力成本的增加,越来越多的企业开始通过自动化某些任务来应对这些挑战。
这些自动化技术的应用,不仅提高了生产效率,还降低了生产成本,使得企业在激烈的市场竞争中保持了优势。
此外,在劳动力稀缺的地区,机器人自动化的应用甚至可能增加人类劳动力的就业机会,因为企业可以通过自动化来弥补劳动力的不足,从而扩大生产规模,创造更多的就业机会。
我们政府也充分认识到了机器人自动化在促进经济增长中的潜力。在2022年发布的五年计划中,我们政府明确提出了要成为我们国家工业自动化的全球领导者的目标。
这一计划的出台,不仅反映了我们政府对机器人自动化技术的重视,也体现了我们国家应对人口老龄化挑战的决心。
具体来说,机器人自动化在我们国家的应用将有望解决由抚养比上升所带来的一系列问题。通过提高生产效率,机器人自动化可以确保年轻工人获得更高的工资收入,从而增强他们为养老基金缴款的能力。
同时,保持高于预期的经济增长率也将有助于我们国家更轻松地应对财政压力,平衡医疗保健支出和老年人社会服务需求与其他领域的支出之间的关系。
只是机器人自动化的应用也有一些顾虑。
首要的问题便是劳动力贬值的问题。在我们国家制造业内部,已经开始出现对熟练劳动力贬值的担忧。由于机器人和先进制造技术的广泛应用,许多以前由熟练工人执行的任务现在可以由这些技术来完成,导致熟练工人被降级到更常规、工资更低的职位上。这种变化不仅影响了工人的收入水平,还对他们的职业发展和工作满意度产生了负面影响。
如果机器人自动化的效果过于显著,劳动力稀缺可能不足以保护我们国家生产工人免受自动化对劳动力成本较高国家(如美国或英国)可能构成的威胁。
这些威胁包括减薪、工人讨价还价权力的减少以及失业率的增加。事实上,对我们国家机器人采用率的研究已经证实了这一点。
研究表明,企业层面机器人采用率的增加会降低制造业工人的就业概率,从而对劳动力市场产生负面影响。
一些我们国家企业甚至明确表示,他们希望利用自动化来弥补劳动力的短缺,并取代现有的劳动力。这种趋势虽然可能在企业层面和国家层面带来一定的经济利益,但也可能对大部分工人阶级的个人利益造成损害。
因此,在推动机器人自动化的过程中,我们政府需要充分考虑其分配后果以及劳动力转移对劳动力增加可能产生的影响。
但不管怎么说,机器人自动化仍然被视为我们国家应对人口危机的重要手段之一。
随着我们国家向服务和消费驱动型经济转型,并开始逐渐淡化其传统经济核心——制造业的地位,政府正在大力发展机器人自动化技术,以抵消目前正在经历的人口下降和老龄化危机所带来的影响。
工业机器人的广泛应用和聊天机器人的兴起,正在改变着人类的工作方式和生活方式。这些新技术的出现,使得越来越多的工作可以被机器人所替代,从而引发了人们对于未来就业市场的担忧。
对于我们国家来说,这种新现实可能并不是一个坏事。相反,它可能为我们国家提供了一个应对人口老龄化和劳动力短缺问题的独特机遇。
从国际经验来看,那些成功经受住老龄化和低生育率风暴的国家,往往都得益于自动化的广泛应用。这些国家通过引入机器人自动化技术,提高了生产效率,降低了生产成本,从而保持了经济的持续增长。
我们国家似乎也已经认识到了这一潜力,并正在朝着正确的方向前进。
本文作者 | 王丛予
审校 | 童任
配图来源 | 腾讯新闻图库、头图由ai生成
数据来源 | 浙大《2024年中国养老产业商学研究报告》、中国新闻网、海报新闻、世界银行集团、百度智慧数据、人民网
编辑/出品 | 东针-知识频道
中国老龄化时代,机器人救场
2025年1月13日 -
人工智能(AI)正以前所未有的速度重塑着各行各业,从医疗保健到零售、金融到制造,无一不受到其深远影响。
AI不仅极大地提升了生产力、优化了成本管理,还激发了前所未有的创新活力。其中,Gen AI作为使机器能够自主创建内容的关键技术,更是成为了万众瞩目的焦点。
随着企业对于AI应用的深入探索,他们开始越来越倾向于寻找更加定制化、贴合自身运营需求的AI解决方案。
全球知名的市场情报提供商国际数据公司(IDC)近期与微软携手进行了一项深入研究,揭示了AI对于全球经济的潜在影响正日益显著。
据预测,到2030年,AI将为全球经济贡献高达19.9万亿美元的增长。这一数字不仅彰显了AI的巨大潜力,也预示着一个由AI驱动的新时代的到来。
微软商业云和AI首席营销官Alysa Taylor在一篇博文中,以微软的Copilot AI为例,生动描绘了AI如何在全球范围内改变着各行各业的面貌。
在电信领域,Lumen Technologies通过引入Copilot,成功为卖家每周节省了4个小时的工作时间,换算成年节省额,这一数字高达5000万美元。
在医疗保健方面,奇美医疗中心的医生们现在只需花费15分钟就能完成一份医疗报告,相较于过去的一个小时,效率得到了显著提升。同时,护士们也能在五分钟内完成患者信息的记录,而药剂师每天接诊的患者数量更是实现了一倍的增长。
在零售业,AI模型帮助Coles精准预测了20,000个库存单位在850家商店的流向,每天生成高达16亿个预测结果,为企业的库存管理提供了有力支持。
一、提高生产力已成为企业的核心追求
微软2024年AI研究的核心发现之一指出,提高员工生产力已成为企业至关重要的业务目标。研究结果显示,高达92%的AI用户正在专门应用AI工具来提升生产力。在这些企业中,近半数表示AI对于客户参与、成本管理和服务创新的影响将在未来几年内产生深远影响。
以全球营销和广告公司Dentsu为例,该公司已经开始利用AI来简化日常任务,如会议总结、演示文稿生成和执行摘要准备等。Dentsu业务战略经理Takuya Kodama表示:“Copilot改变了我们向客户提供创意概念的方式,实现了实时协作。”通过AI自动化,Dentsu的每位员工每天都能节省15到30分钟的时间,从而有更多精力投入到战略工作中去。这一趋势凸显了企业对Gen AI工具的日益依赖,这些工具能够自动执行日常任务,显著提升企业的运营效率。随着AI技术的不断成熟,许多企业期待从这些工具中获得更大的回报,进一步减少体力工作并加速决策过程。
二、企业正倾向于采用更先进的AI解决方案
虽然像微软Copilot这样的新一代AI工具在市场上获得了广泛关注,但这份报告还强调了企业向更先进、更定制化的AI解决方案转变的趋势。许多企业正在寻求开发适合自身特定业务流程和行业需求的定制AI代理和应用程序。
研究预测,在未来24个月内,企业将越来越多地超越开箱即用的AI工具,转而寻求更加专业的AI解决方案。以全球工程巨头西门子为例,该公司开发了西门子工业副驾驶(Siemens Industrial Copilot),通过自动化任务和提高运营效率来解决制造业日益增长的复杂性和劳动力短缺问题。Siemens Digital Industries的人工智能策略师Boris Scharinger表示:“Siemens Industrial Copilot for Engineering显著减轻了客户的工作量,并解决了技能短缺的紧迫挑战。”这一转变代表了AI采用的日益成熟,企业正寻求在更复杂、更特定行业的环境中应用AI。
三、各行业AI的采用率和价值持续增长
Gen AI的快速崛起是Microsoft/IDC研究中确定的另一个关键趋势。从2023年到2024年,Gen AI的采用率从55%增长到75%。这一激增在金融服务、媒体、电信和医疗保健等行业尤为显著,Gen AI工具在这些行业的客户服务、内容创建和运营效率方面带来了显著提升。
以医疗保健领域为例,美国主要卫生系统普罗维登斯正在利用AI来简化患者护理并改善临床工作流程。通过使用Microsoft DAX Copilot,医生们减少了在管理任务上花费的时间,每次就诊平均节省了5.33分钟。普罗维登斯执行副总裁兼首席战略和数字官Sarah Vaezy表示:“80%的医生表示,使用DAX Copilot后认知负担减轻了。”Gen AI在这些领域不断增长的价值体现在其自动化日常任务、改进决策和增强患者护理的能力上。
四、AI领导者正在获得更大的回报和加速的创新
Microsoft/IDC的研究还揭示了早期采用者和仍处于AI实施早期阶段的企业之间在AI投资回报上的差异。将Gen AI集成到运营中的公司的平均投资回报率(ROI)为3.7倍,而该领域的领导者的ROI更是高达10.3倍。
瑞典林业集团Södra是从AI中获得显著回报的公司之一。通过使用AI管理气候影响数据并每天做出数千个决策,Södra提高了环境可持续性和盈利能力。Södra首席数字官Cristian Brolin表示:“借助Microsoft的创新AI技术,我们的业务专家和数据科学家能够帮助我们提高可持续发展能力,同时显著提高收入。”这些结果表明,在AI采用过程中已经处于领先地位的企业正在获得更大的收益,无论是在财务上还是在创新方面。
五、展望未来:技能短缺仍是首要挑战
尽管AI带来了显而易见的好处,但其广泛采用的一个重大障碍仍然是缺乏能够实施和管理AI技术的熟练工人。研究发现,30%的受访企业正在努力寻找具备必要AI专业技能的员工。微软和LinkedIn的另一份报告也指出了这一挑战,该报告发现55%的企业领导者担心自己担任AI相关职位的能力。
为了应对这一挑战,一些组织正在积极寻求解决方案。例如,南佛罗里达大学(USF)正在与Microsoft合作,将AI融入其运营中,并为学生提供在AI驱动的世界中茁壮成长所需的技能。USF首席信息官兼数字体验副总裁Sidney Fernandes表示:“作为未来劳动力的一部分,我们正在帮助学生利用AI做出惊人的事情。”该大学还是全国首批建立AI、网络安全和计算专门学院的大学之一,旨在满足对AI人才日益增长的需求。
随着AI应用的不断增长,对熟练专业人员的需求也在持续增加。这凸显了教育和培训投资的重要性,以充分实现AI的优势。IDC人工智能和数据研究部高级副总裁兼总经理Ritu Jyoti表示:“我们正处于自主代理开发的拐点。”
“到2030年,采用AI的企业支出将对全球经济产生累计19.9万亿美元的影响。”
Microsoft与IDC共探人工智能未来趋势:从Gen AI到员工生产力工具的跨行业应用
2024年12月6日 -
斯坦福大学在机器人研究领域一直走在世界前列,但过去这些研究人员却分散在校园的各个角落,如今,他们终于有了一个统一的、最先进的科研、教育和合作空间——全新的斯坦福机器人中心。
这个中心位于帕卡德电气工程大楼下方的地下室,曾经只是一条昏暗、冷清的研究人员走廊。然而,经过多年的精心规划、筹款和建设,全新的斯坦福机器人中心终于在11月1日迎来了招待会和正式开业。
走进这个全新的机器人中心,首先映入眼帘的是一个明亮、开放、充满活力的空间。宽敞的研究室内,并排排列着各种先进的科研设备。在一个角落里,一名舞者正在翩翩起舞,她的每一个动作都被精确地数字化,并实时投射到附近的显示屏上,让人不禁惊叹于技术的神奇。
而在隔壁的研究室内,一对机械臂正在忙碌地铺床,动作流畅而准确。不远处,另一组研究人员正在调试一台能够准备饭菜的机器人,它灵巧地拿起食材,进行切配和烹饪。而在房间的另一边,一名医学生正专注地盯着一个立体镜头,通过操纵手动工具来进行模拟手术练习。
“我1981年来到斯坦福大学,就一直怀揣着这样一个梦想,”新斯坦福机器人中心主任、空间设计和改造的策划者乌萨马·哈蒂布感慨地说,“除非我们将机器人技术的所有不同研究领域结合在一起,否则机器人技术不可能真正取得突破。机械工程、计算机科学、材料科学、电气工程、人工智能……这些领域之间有着千丝万缕的联系,我们真的需要一个可以称之为‘家’的地方。”
哈提卜是斯坦福大学计算机科学领域的知名教授,他在四十多年的研究生涯中,因多款机器人而登上头条新闻。其中最著名的莫过于他的人形OceanOne潜水机器人。这款机器人曾帮助科学家们探索沉船和深海珊瑚礁,大大降低了人类潜水员的风险。
多学科融合 打造全新科研平台
自20世纪60年代以来,斯坦福大学就一直处于机器人技术的前沿。从“斯坦福车”这种用于月球任务的早期机器人漫游车原型,到“Shakey”这种世界上第一个具有计算机视觉的人工智能机器人,再到改变工厂车间的早期机器人手臂,斯坦福大学在机器人研究领域取得了无数开创性的成果。
而全新的斯坦福机器人中心,正是这些成果的延续和升华。机械工程学教授、粘性机器人发明者马克·卡特科斯基表示:“乌萨马和我至少十五年来一直梦想着建立一个这样的中心。”
卡特科斯基提到的粘性机器人Stickybot,是一款能够使用受壁虎脚趾抓握能力启发的脚来在垂直玻璃面上攀爬的机器人。当时,他和哈提卜就设想建立一个大型中央机器人中心,将各个分散的实验室统一起来,以便更好地组织、开展大型科研项目。
“现在,我们的科研模式往往是自下而上的,”卡特科斯基说,“你可能会看到由一、两名或三名教师组成的小团队,他们聚在一起提出一些科研想法,但这与我们梦想中的大型科研平台还有很大的差距。全新的机器人中心将使我们能够开展更大规模的科研项目,将我们所有不同的技能和领域集中在一次努力中,这将为我们带来很多新的机会。”
家用机器人 助力未来生活
在新的机器人中心里,计算机科学助理教授Jeannette Bohg已经看到了这个平台的优势。她专门研究家用机器人,这些机器人未来可能会走进千家万户,帮助人们打扫房间、洗衣服,甚至陪伴老年人独立生活更长的时间。
Bohg领导着交互式感知和机器人学习实验室,是多所大学共同努力研发的TidyBot项目的关键贡献者。TidyBot是一款家用机器人,它使用计算机视觉和人工智能来识别房间内的日常物品,然后抓取它们并将它们放在适当的位置——无论是洗碗机中的盘子、篮子里的衣服还是书架上的书籍。
Bohg坦言,TidyBot的研发过程中也面临着一个关键的挑战,那就是如何知道“正确的位置”在哪里。因为这对于每个用户来说都是一个主观的决定,机器人必须了解主人的偏好才能完成任务。
为了解决这个问题,Bohg的团队正在致力于研发更加智能的抓握臂和手部组件,让TidyBot能够更好地适应各种环境和任务。而新的机器人中心为她的团队提供了更加宽敞和先进的实验空间。新的家庭套房就像一个小家一样,TidyBot可以在这里进行各种任务的模拟和练习。
“2017年,当我来到斯坦福大学并建立我的实验室时,我发现空间非常有限,这对于我们所做的研究类型来说是一个很大的挑战。”Bohg回忆道,“实验室里到处都是机器人手臂,每个人都坐在彼此的空间里做实验,这极大地限制了我们的研究效率和创造力。”
邻近合作 催生新机遇
机械工程学教授Allison Okamura是医学协作触觉和机器人(CHARM)实验室的负责人。她和她的团队致力于开发先进的触摸交互工具和原理,特别是在生物医学应用中。Okamura开发的机器人手术设备远程操作工具、用于假肢和身体康复的机器人以及用于高风险环境中检查和搜救的仿生机器人,都取得了显著的成果。
对于Okamura来说,新机器人中心提供的最大优势就是邻近性带来的合作机会。她预计,各个实验室之间将有更多的机会了解彼此的研究方向,并寻求合作的可能性。
“这种合作的机会已经出现了。”Okamura说。她描述了一次最近的会议,当时她的团队正在测试并准备演示一款柔软蛇形机器人,这款机器人可以在地震地区进行救援行动。而另一个实验室的一名学生走过来表示,他们一直在寻求将机器学习应用于这种蛇形机器人的方法。
“直到看到它我才知道,但这正是我所需要的。”这名学生激动地说。于是,一次全新的合作就此诞生。Okamura的学生现在正在撰写完整的论文章节,讲述这次偶遇所带来的研究成果。
独特设计 打造非凡科研空间
斯坦福大学工程学院设施和规划副主任布莱恩·卡里利对建造新机器人中心所需的一切都有着深入的了解。他帮助设计了新空间并管理了扩建工作。
卡里利见证了新机器人中心从哈提卜和一些密切合作者头脑中的一个单纯概念,发展成为一个与世界上任何其他机器人中心都不同的非凡科研蜂巢。他负责建议该中心采用独特的灯光设计,让嵌入式天花板看起来像真正的窗户,蔚蓝的天空下飘着白云,将原本昏暗的地下室变成了一个明亮而充满活力的空间。
此外,卡里利还为满足新机器人中心各个科研团队的独特需求而自豪。医疗套房内配备了一台当今世界上最先进的手术机器人;家庭套房内则设有洗衣机/烘干机和功能齐全的厨房。这些设施为科研人员提供了更加便捷和高效的实验环境。
哈提布指出,新机器人中心的发展仍在继续。他指着一个空荡荡的研究区域说:“我想象着这里将来会成为一个独特的功能区——一个用厚厚的透明玻璃围起来的水族馆,里面装有数千加仑的搅拌海水,我们的游泳机器人可以在这里微调它们的水下探索技能。”
尽管预算和技术挑战仍然存在,但哈提布希望有一天能够在这个真实的水下环境中测试他的OceanOne机器人。在土木与环境工程系的帮助下,哈提卜和卡里利正在制定安装泵的计划,这些泵可以将大量海水(每分钟30000加仑)输送到水箱中,以模仿海洋强大的水流。
如今,新机器人中心的实验室和科研人员已经开始意识到这个平台的巨大潜力,并享受着这个专为他们的需求而设计的共享空间。“今天的斯坦福机器人中心真是太漂亮了!”哈提布由衷地感叹道,“每个人——院长、教师、学生以及我们在工业界和学术界的合作伙伴——都非常高兴看到它成为现实。”
斯坦福大学打造全新多学科“统一”机器人中心
2024年11月25日 -
科技巨头们正越来越多地投资于所谓的“主权”人工智能(AI)模型的开发。
这一趋势背后的主要驱动力是,通过更多地关注当地的基础设施,企业可以提高自身的竞争力,并更好地满足当地市场的需求。
“主权AI”是一个相对较新的术语,大约在过去一年左右开始被广泛提及。
思科公司布鲁塞尔欧盟公共政策领导克里斯·高在接受CNBC采访时表示,随着全球对数据主权和隐私保护的关注度不断提升,越来越多的企业开始考虑将AI模型和数据存储在本国或本大陆的基础设施上。
目前,许多最大的语言模型(LLMs),如“开放”的TA-1和“人类的克洛德”,都使用美国的数据中心通过云存储数据和处理请求。
这种对美国技术的依赖已经引起了欧洲政治家和监管者的担忧。
他们担心这种依赖不仅会对欧洲的竞争力造成损害,更令人担忧的是,这可能会影响到技术的复原力和安全性。
数据主权是指人们的数据应当存储在他们居住的国家或大陆的基础设施上。
这一概念的兴起,部分原因是由于企业对新规定作出的反应。
例如,欧洲联盟的一般数据保护条例(GDPR)要求公司以尊重用户隐私权的方式处理用户数据,并确保数据的安全性和合规性。
这些规定引发了欧洲公民对数据是否可以安全地跨境转移的疑问。
欧洲法院于2020年宣布欧盟与美国的诉讼无效数据共享框架,理由是这一框架没有提供与GDPR所保障的欧盟内部保护水平相同的保护。
为了应对这一挑战,欧盟和美国去年共同推出了欧盟-美国数据隐私框架,以确保数据能够安全地在欧盟和美国之间流动。
这些政治发展推动了云基础设施的本地化,为许多在线服务提供了存储和处理数据的场所。
法国云计算公司OVHcloud的全球初创企业营销和运营主管菲利普·萨内西表示,这家法国云计算公司看到了对位于欧洲的基础设施的大量需求。
他说:“他们理解在欧洲拥有数据的价值,而这些数据受欧洲法律管辖。”
随着数据主权的概念变得越来越成熟,越来越多的公司认识到了将数据放在一个特定的权限和治理之下的重要性。
萨内西说:“我们有很多数据,根据具体条例,这些数据在特定国家具有主权。现在,有了这些数据,你实际上可以为AI制造产品和服务,而这些服务应该是主权的,应该由当地人才为当地居民或企业进行控制、部署和开发。”
据思科公司的克里斯·高表示,AI主权的推动目前还没有被监管机构所推动,至少目前还没有。
他说,相反,这一推动来自欧洲的一些私营公司,这些公司在欧洲开设了更多的数据中心,以支持基于云的人工智能工具。
克里斯·高说:“主权AI更多的驱动力来自于行业对它的命名,而不是来自决策者一方。你还没有看到在监管方使用的‘AI主权’术语。”
各国政府正在积极推动AI的主权概念,因为他们认识到AI是“未来”和“大规模的战略性技术”。
为了提升国内科技公司和生态系统,以及支持AI服务的重要后端基础设施,各国政府正在制定相关政策和计划。
在意大利,今年夏天发布了专门针对意大利语数据的第一个法律硕士项目——意大利9b。
该项目的目的是将结果储存在一个特定的管辖区,并依靠该区域内公民的数据,从而使AI系统产生的结果更以当地语言、文化和历史为基础。
恩维迪亚公司的霍根表示:“主权AI是为了反映一个组织的价值,或者说,你所在的国家、价值观和语言。”
霍根补充道,目前的核心挑战是,大多数前沿模型主要是在西方数据方面接受培训的。例如,在丹麦,政府官员担心由AI系统提供的医疗和电信等重要服务不能“反映”当地的丹麦文化和价值观。
为了应对这一挑战,丹麦提出了一份具有里程碑意义的白皮书,概述了公司如何按照即将出台的欧盟AI法案使用AI。该文件旨在为其他欧盟国家提供一个蓝图,供其遵循和通过。
这并不是说监管没有证明是促使科技巨头更多考虑在欧洲建立本地AI基础设施的重要因素。
像欧盟的GDPR这样的法规促进了许多对特定地区数据处理的外包支持的兴趣。同时,AI主权的概念也得到了当地欧洲科技公司的支持。
早些时候,总部设在柏林的搜索引擎EcoSia及其总部位于巴黎的同行Qwant宣布成立合资公司,从头开始开发欧洲搜索索引。
这一举措旨在提高法语和德语的效果,并更好地满足当地用户的需求。
同时,法国电信运营商Orange表示,正在与许多基础AI模型公司讨论为其客户建立一个基于智能手机的“主权AI”模型,以更准确地反映他们自己的语言和文化。
Orange公司的首席技术官布鲁诺·泽尔比布告诉CNBC:“建立自己的LLM是没有意义的。所以现在有很多讨论,我们如何与现有供应商合作,使其更本地化和更安全?”
泽尔比布补充道,在很多情况下,[AI数据]可以在本地(电话)处理,而不是在云上处理。
但Orange还没有为这些主权AI的雄心选择合作伙伴。
科技巨头竞相投资“主权”AI模型,数据本地化成新战场!
2024年11月19日 -
32度域科技信息部门研究发现,前段时间全球科技界的几个巨头——如亚马逊、微软和谷歌,纷纷晒出自家最新财报,显示它们在AI(人工智能)上的数百亿美元押注,似乎终于开始有了回报的苗头。
巨头们说,这只是开始,更大的手笔还在后头。
在上个季度,这几家公司的云业务总收入加起来达到了629亿美元,比去年同期涨了22.2%,而且这已经是连续四个季度加速增长了。
不过,现在有个新风向,光靠AI训练已经不足以支撑它们的资本支出了。要想让这些巨头们继续大规模买芯片、建数据中心,得看到AI推理上的成功,也就是应用层能不能爆发。这是现在大家关注的焦点中的焦点。
微软的首席财务官Amy Hood在分析师电话会上就说了:“需求还是高于我们的供应能力。”
之前市场一直担心,这些硅谷公司会不会因为对AI太憧憬,结果在云能力上过度支出。这些创纪录的资本支出,时不时就会让市场震动一下,有时候还会导致纳斯达克指数下跌。但现在看来,这个增长的神话还在延续。
于是大家继续“烧钱”,使劲往业务上砸金币。
亚马逊、微软和谷歌的最新财报显示,上个季度它们在不动产和设备上的支出,达到了惊人的506亿美元,去年同期这个数字是305亿美元。
这些钱有很大一部分都流向了支持AI的数据中心。
而且这三家公司都提到,未来几个月它们的支出还会继续涨。Meta也是一样,Meta为了给自家Instagram、WhatsApp和Facebook上的AI应用提供基础设施支持,也不惜投入大量资金。
扎克伯格的计划是,借助现有的社交平台,打造一个全球使用量第一的AI助手。所以Meta上个季度在AI基础设施上投入了83亿美元,比去年同期多了18亿美元。扎克伯格说:“我们对AI的投资还需要强大的基础设施支持,我预计还会在这方面继续大力投入。”
那这些烧钱的动作,现在给各家带来了什么呢?
最明显的还是云服务,它的强劲增长给这些“大饼”提供了一些证据。
本来云服务的发展势头在2022年初有所减弱,很多公司的云业务都有所降温。但过去一年里,AI的出现让整个行业重拾增势,因为大量AI开发者开始为此支出,他们需要比传统软件公司更强的处理能力。除了直接受益于AI浪潮的芯片公司外,云业务就成了另一个能证明AI影响的领域。
在云业务上长期排第三的谷歌,Q3云业务收入增长了35%,大超预期,股价也涨了。亚马逊财报后股价也涨了近6%,还披露说公司的云AI业务有望产生数十亿美元的年收入,增速超过30%,比AWS的整体业务增速还快。
不过微软的股价在财报后下跌了6%,因为微软下调了云业务的增长预期,原因是数据中心建设速度跟不上。但这个短暂的逆风预计不会影响微软的大局,这个财季里,AI产品和云服务的年化销售额料将首次超过100亿美元。
比如在过去六个月里,微软一项可通过云平台销售、接入OpenAI技术的服务,其使用量增加了一倍,使用该服务的客户包括Grammarly和Harvey等AI初创公司。
对于“对AI投入是否过多”这个问题,谷歌CEO Sundar Pichai在今年Q2财报电话会上说:“我认为我思考这个问题的方式是,当我们经历这样的曲线时,对我们来说,投资不足的风险远远大于投资过度的风险,即使在最终结果表明我们投资过多的情况下也是如此。”
这样的思路在Q3仍然延续,甚至还会继续持续到明年。各家投行也陆续上调了明年资本开支预测,摩根士丹利把亚马逊、谷歌、Meta、微软4家的总资本开支从原本的2700亿美金上调到3000亿美金,主要增量来自亚马逊。
但现在要想继续推动AI浪潮,光靠Capex路线是不太够了,质疑声会越来越大。市场很快就会进入要看到应用侧进展的阶段。特别是对2025年Capex的预期越高,2026年能否实现可观增长的难度就越大。
所以明年推理需求能否爆发,是举足轻重的核心议题。微软、亚马逊和谷歌都在快速开发面向消费者和企业的AI产品,比如谷歌的Gemini和微软的Copilot。
还有OpenAI o1提出的推理层面的Scaling Law,能否在各个下游领域获得验证,尤其是在经济模型上被验证,明年是一个重要的观察点。只有推理侧爆发,GPU才能从“成本项”变成“资产项”。
谷歌就是一个很好的例子。谷歌的主要收入依赖搜索广告,而采用生成式AI的搜索可能会对收入产生负面影响。但除了对传统搜索广告收入空间的挤压外,AI也带来了产品功能升级,特别是多模态(比如图片搜索),显著提高了用户体验和搜索频率。据谷歌的业绩发布会披露,比如像Circle to Search这样的小功能(可以让用户随意圈出自己想搜索的内容),已在1.5亿部安卓设备上推出,每周有三分之一的用户使用;Lens视觉搜索每月处理超过200亿次查询,成为增长最快的搜索类型,且大多数查询结果促进了用户购物。
这两项核心搜索功能都依赖于多模态的AI技术,也可以被视为应用层的一点小突破。再结合谷歌同比增长15%的收入、搜索和YouTube广告收入均实现了两位数的同比增长,整体超越市场预期。
黄仁勋对AI如何提升生产力有一个充满雄心的预测,他说英伟达现在有3.2万名员工,但希望英伟达在未来某天成为一家拥有5万名员工的公司,同时配有1亿个AI辅助每个员工。
黄仁勋还表示,将构建一个AI擅长哪些事务的目录,公司收件箱里也会充满这些擅长不同事务的AI发来的信息,AI也能够自组织,能自行招募其它AI来组成团队解决问题,它们还会自行在Slack频道里交流,也会跟人类员工交流。
“可以说,我们就是一个庞大的员工群体,其中一些是数字化的AI,另一些则是生物体的人类,我还希望未来某天,其中一些会是电子化的机器人。”黄仁勋说。
数据中心投资近年来如火如荼,预计还能持续一段时间,但下一步需要靠推理/应用层来接棒。
这是科技巨头们一个普遍的共识。
摩根士丹利甚至算了一笔账,预计2025年美国主要科技巨头的各种AI投入加起来合计有4000-4500亿美金(GPU、数据中心等等),这个支出数字已经超过阿波罗登月计划的总额。
虽然现在还看不出AI对生产力的重大切实影响,但各种产品其实已经如雨后春笋般冒出来,从巨头到创业公司都有。
如果按黄仁勋的愿景发展,世界在未来会分为“AI穷人”和“AI富人”,能否成功应用AI的关键,是能否在业务中找到内部的上下文场景,继而在生产中最大限度地利用这些AI应用。
3个月烧掉500亿美金,AI热潮返场,“大鳄们”继续砸钱!
2024年11月8日 -
科技巨头Meta 财报显示,第三季度收入飙升19%,直接冲上了405.9亿美元的高点,这可是近年来Meta的“钱袋子”最鼓的一次。
CEO马克·扎克伯格喜笑颜开,还说这一波增长全靠Meta在应用程序和业务上的人工智能“黑科技”。
在10月30日的财报电话会议上,Meta亮出了最新的成绩单:净利润大涨35%,直接飙到了156.8亿美元,每股还能赚6.03美元,这可真是赚得盆满钵满。
首席财务官Susan Li更大胆预测,第四季度收入还得再涨50亿美元,直奔450-480亿美元的区间而去。
扎克伯格心情大好,他在会上说,Meta“围绕人工智能和计算机未来的长期愿景”已经越来越清晰了。他还透露,Meta AI现在每个月都有5亿活跃用户,人气爆棚!
他还表示,AI驱动的信息流和视频推荐让用户们在Facebook和Instagram上玩得更嗨了,今年在Facebook上花的时间多了8%,Instagram上也多了6%。
更有超过100万的广告商眼馋Meta的生成式AI工具,上个月就制作了超过1500万条广告,这可真是AI变现的“大杀器”。
不仅如此,扎克伯格还炫耀起了Meta的大型语言模型。
他说,最新的法学硕士模型Llama 4正在紧锣密鼓地开发中,预计明年初就能推出更小巧的型号。他还说,这将是“一件大事”,新功能和速度都会让人眼前一亮。
这么多好处可不是白来的。
扎克伯格坦言,人工智能的进步将加速Meta核心业务的发展,所以必须得加大投资力度。他说:“我们的人工智能投资还得继续,基础设施得跟上,这方面我们可是要下大力气的。”
虽然他没透露具体要花多少钱,但Susan Li表示,Meta的基础设施容量将大幅“扩容”,看来Meta这次是要玩票大的了。
不过令人大跌眼球的是市场反应,虽然Meta的业绩和前景都看起来很美好,但股市却并不买账。财报发布后,Meta的股价竟然下跌了4%。
据路透社报道,投资者们可能对Meta大规模的人工智能支出计划感到心里没底,毕竟这可是个烧钱的活儿。
毕竟Meta在人工智能上的麻烦可不少。上周发布了Llama 3.2 AI模型的紧凑版本,但在欧盟地区却无法使用更大的多模态模型,比如Llama 3.2、11B和90B这些能处理文本、图像、音频和视频等多种格式的“全能选手”。
Meta表示,由于欧盟的监管环境“不可预测”,所以暂时不会在欧盟发布这些模型。
Meta甚至还取消了使用成人在Facebook和Instagram上共享的公共内容来训练大型语言模型的计划。
无论怎么说,Meta这次应该是铁了心要下血本在人工智能领域了,至于是否能大展拳脚,犹未可知,但至少Meta的“AI梦”已经变得越来越清晰了。
Meta收入狂飙,计划豪掷千金押注人工智能未来
2024年11月1日