科技巨头竞相投资“主权”AI模型,数据本地化成新战场!
科技巨头们正越来越多地投资于所谓的“主权”人工智能(AI)模型的开发。
这一趋势背后的主要驱动力是,通过更多地关注当地的基础设施,企业可以提高自身的竞争力,并更好地满足当地市场的需求。
“主权AI”是一个相对较新的术语,大约在过去一年左右开始被广泛提及。
思科公司布鲁塞尔欧盟公共政策领导克里斯·高在接受CNBC采访时表示,随着全球对数据主权和隐私保护的关注度不断提升,越来越多的企业开始考虑将AI模型和数据存储在本国或本大陆的基础设施上。
目前,许多最大的语言模型(LLMs),如“开放”的TA-1和“人类的克洛德”,都使用美国的数据中心通过云存储数据和处理请求。
这种对美国技术的依赖已经引起了欧洲政治家和监管者的担忧。
他们担心这种依赖不仅会对欧洲的竞争力造成损害,更令人担忧的是,这可能会影响到技术的复原力和安全性。
数据主权是指人们的数据应当存储在他们居住的国家或大陆的基础设施上。
这一概念的兴起,部分原因是由于企业对新规定作出的反应。
例如,欧洲联盟的一般数据保护条例(GDPR)要求公司以尊重用户隐私权的方式处理用户数据,并确保数据的安全性和合规性。
这些规定引发了欧洲公民对数据是否可以安全地跨境转移的疑问。
欧洲法院于2020年宣布欧盟与美国的诉讼无效数据共享框架,理由是这一框架没有提供与GDPR所保障的欧盟内部保护水平相同的保护。
为了应对这一挑战,欧盟和美国去年共同推出了欧盟-美国数据隐私框架,以确保数据能够安全地在欧盟和美国之间流动。
这些政治发展推动了云基础设施的本地化,为许多在线服务提供了存储和处理数据的场所。
法国云计算公司OVHcloud的全球初创企业营销和运营主管菲利普·萨内西表示,这家法国云计算公司看到了对位于欧洲的基础设施的大量需求。
他说:“他们理解在欧洲拥有数据的价值,而这些数据受欧洲法律管辖。”
随着数据主权的概念变得越来越成熟,越来越多的公司认识到了将数据放在一个特定的权限和治理之下的重要性。
萨内西说:“我们有很多数据,根据具体条例,这些数据在特定国家具有主权。现在,有了这些数据,你实际上可以为AI制造产品和服务,而这些服务应该是主权的,应该由当地人才为当地居民或企业进行控制、部署和开发。”
据思科公司的克里斯·高表示,AI主权的推动目前还没有被监管机构所推动,至少目前还没有。
他说,相反,这一推动来自欧洲的一些私营公司,这些公司在欧洲开设了更多的数据中心,以支持基于云的人工智能工具。
克里斯·高说:“主权AI更多的驱动力来自于行业对它的命名,而不是来自决策者一方。你还没有看到在监管方使用的‘AI主权’术语。”
各国政府正在积极推动AI的主权概念,因为他们认识到AI是“未来”和“大规模的战略性技术”。
为了提升国内科技公司和生态系统,以及支持AI服务的重要后端基础设施,各国政府正在制定相关政策和计划。
在意大利,今年夏天发布了专门针对意大利语数据的第一个法律硕士项目——意大利9b。
该项目的目的是将结果储存在一个特定的管辖区,并依靠该区域内公民的数据,从而使AI系统产生的结果更以当地语言、文化和历史为基础。
恩维迪亚公司的霍根表示:“主权AI是为了反映一个组织的价值,或者说,你所在的国家、价值观和语言。”
霍根补充道,目前的核心挑战是,大多数前沿模型主要是在西方数据方面接受培训的。例如,在丹麦,政府官员担心由AI系统提供的医疗和电信等重要服务不能“反映”当地的丹麦文化和价值观。
为了应对这一挑战,丹麦提出了一份具有里程碑意义的白皮书,概述了公司如何按照即将出台的欧盟AI法案使用AI。该文件旨在为其他欧盟国家提供一个蓝图,供其遵循和通过。
这并不是说监管没有证明是促使科技巨头更多考虑在欧洲建立本地AI基础设施的重要因素。
像欧盟的GDPR这样的法规促进了许多对特定地区数据处理的外包支持的兴趣。同时,AI主权的概念也得到了当地欧洲科技公司的支持。
早些时候,总部设在柏林的搜索引擎EcoSia及其总部位于巴黎的同行Qwant宣布成立合资公司,从头开始开发欧洲搜索索引。
这一举措旨在提高法语和德语的效果,并更好地满足当地用户的需求。
同时,法国电信运营商Orange表示,正在与许多基础AI模型公司讨论为其客户建立一个基于智能手机的“主权AI”模型,以更准确地反映他们自己的语言和文化。
Orange公司的首席技术官布鲁诺·泽尔比布告诉CNBC:“建立自己的LLM是没有意义的。所以现在有很多讨论,我们如何与现有供应商合作,使其更本地化和更安全?”
泽尔比布补充道,在很多情况下,[AI数据]可以在本地(电话)处理,而不是在云上处理。
但Orange还没有为这些主权AI的雄心选择合作伙伴。