客观日本

未雨绸缪,日本积极筹建“主权AI”

2025年12月12日 信息通信

如果你是一名日本科技的观察者,你会发现有一个词正在日本科技界悄悄地流行。这就是“主权AI(Sovereign AI)”。

title

顾名思义,“主权AI”意味着一个国家要拥有能由自己主导、自己控制的人工智能系统,而不是完全依赖外国的AI技术与数据。“主权AI”将AI的技术与应用提升到主权的高度,即国家层面的AI主权。“主权AI”具体地涵盖四个方面的要素。

数据主权:国家或地区自己掌控数据,而不是让数据被海外企业集中掌握;

计算主权:拥有自己的本土算力设施(超级电脑、数据中心、AI专用芯片等);

模型主权:开发或拥有本国主导的大型语言模型(LLM);

法规与安全:AI 的使用标准、隐私保护、审查方式由本国制定,而非由海外企业间接决定。

“主权AI”被频繁地提及的原因是AI所带来的隐患与风险。国家层面的风险涉及以下四个方面。

1. 安全风险与战略自主:国家关键领域(政府、医疗、交通、国防)不能被外国AI技术完全支配。假如日本政府的数据完全依赖外国云服务,那么,军事、警察、基础设施信息也可能受制于外国技术路线;

2. 经济竞争:AI 会成为未来经济的发动机,倡导与加强主权AI,是试图在未来的经济竞争中争得先机;

3. 文化与语言适配:日本企业、政府发现,外国AI对日本语文本的理解、制度、行政文化不是特别适配。日本社会讲究“空气”、“曖昧表現” 、“敬語”等,通用AI往往不够本地化。于是出现培养“日本语特化AI”的需求;

4. 避免数据外流:企业和政府担心机密信息被上传到海外公司的模型中,因此需要本地可控的AI模型与服务。

客观地看,日本在AI技术的开发与应用方面实力不菲,无论是LLM的开发,还是AI技术的应用与落地,都处于世界的前列。那么,为何日本却频繁地提及“主权AI”呢?笔者认为,其一,这与日本的危机意识有关。日本文化里,危机意识很浓,未雨绸缪,主动应对;其二,目前AI的国际竞争呈现出美中两强两极的态势,日本在云服务与LLM开发(也即前述“数据主权”与“模型主权”方面,倾斜式地依赖美国的AI巨头,如OpenAI、Google、Microsoft、Meta等。在这种形势下,倡导“主权AI”也就在情理之中了。

事实上,“主权AI”这一概念并非由日本创造,而是诞生于欧洲。随着数据流通、云服务、跨境数据存储与处理等问题变得敏感后,“AI主权(AI sovereignty)”就成为“数据主权 (data sovereignty)/数字主权 (digital sovereignty)” 讨论的自然延伸。在欧洲,几年前制定了《通用数据保护条例》(GDPR)等隐私与数据保护法规,出于对外国大型科技公司 (云服务、AI 服务) 依赖的忧虑,使得 “必须掌握本地数据、基础架构、安全管理权” 的呼声变得强烈。基于这种历史背景,“国家/地区必须拥有自己可控的数字基础设施”这一理念逐渐孕育出“AI 也应该本地化、本国主导”的想法。由于欧洲在AI全球竞争中的定位与日本相似,产生于欧洲的理念更容易引起日本的共鸣。

“主权AI”这一概念的推广,离不开一些大型科技公司的营销。例如AI芯片的龙头公司英伟达(Nvidia)在 2023 年左右,通过公开财报以及演讲的方式,把 “主权AI (国家/地区自主AI框架)” 作为一种战略方向加以推广,从而让这一概念随着产业与全球政治经济格局的变化,在全球范围内迅速流行起来。

在日本“主权AI”最早出现在“日本甲骨文(Oracle)”2024年3月29日官网发布的新闻稿。紧接着在 2024年5月~8月,英伟达日本与多家日媒开始频繁使用并推广“主权AI”这一说法。2024下半年起,NTT Data与日本甲骨文等企业以及各大技术媒体的新闻稿中频繁出现“主权AI”,形成公众舆论与产业议程的扩散。

经过一年多紧锣密鼓的论证,日本的产学官三方对“主权AI”已从“概念讨论”进入实际落地。即,政府在做规范与试点;企业在部署“主权云与合作方案”并推出日语/行业化模型;学界在做国产LLM与数据集研发。整体处于“多点并行、加速推进,但仍面临算力、数据与经费协同”的阶段。

一、政府(政策引导+试点、指南、采购方向指导)

制定与发布使用及采购指引:数字厅已对生成式 AI 的行政利用、采购与风险管理制定发布指导文件,并推动安全可控的使用环境建设(含技术验证、hackathon 等试点活动)。这说明中央层面在把生成AI的“可控化/主权化”纳入行政治理流程。

实务型试点:数字厅在2024–2025年间开展了生成AI业务利用的技术验证与环境整备,并举办系列Hackathon、“法令×数字”等活动,以挖掘政府可行的用例并验证安全性。

政治层面支持:政府在公开场合支持“国产/日语LLM”的开发与对外推广,显示国家层面对“主权AI / 国产AI”有战略意向。

二、产业界(主权云、合作方案与企业级落地)

主权云服务:富士通与日本甲骨文宣布面向日本市场、强调数据主权的“主权云”协作方案,定位是在本地数据中心与透明运营下提供“云+生成AI服务”。这类商业化解决方案是“主权AI”落地的重要路径。

大型厂商与平台商参与:英伟达、甲骨文、微软等在日本市场推广“主权AI”概念,与本地厂商合作(合作内容包括专用硬件、在地部署方案、政府/企业专用实例),推动企业客户采用“可控算力+本地数据”模式。

企业内部与行业解决方案:日立、NEC、富士通、NTT Data 等日本国内AI大厂在其产品与咨询路线中,把“日本语适配、数据留置与安全性”作为卖点并开发行业化模型与服务。NTT 等大企业也在公开场合要求更快速的法规与治理,说明企业既推动落地也在强调规则框架。

三、学界与研究机构(国产模型与开放社区在发力)

研究机构与大学:国立信息学研究所(NII)、东京大学、国立情报通信研究机构(NICT) 等在推进日本语或多模态的模型研发(包含公开数据集、开源模型、行业/医疗专用模型研发计划),并参与政策与标准化讨论。东京大学发布了日本语多模态模型,NII 明确呼吁需要“良质大量日本语”用于训练国产 LLM。

社区与产学协作: LLM-jp 等民间学术社区聚集研究者与工程师,快速推动本土数据集、评测、开源模型工作,成为政府与企业的技术补给窗口。大学与国立新能源产业技术综合开发机构(NEDO)等机构亦有项目资助与竞赛,培养人才与产出模型。

可以看出围绕“主权AI”,日本正在积极地展开日本特色的“官民一体”化布局。当然,在争夺AI竞争主导权的路上,前途漫漫,依然面临如下的挑战。

算力与供应链依赖:高端GPU与数据中心设备仍高度依赖海外供应(这限制着国家完全“自主”)。虽然企业合作(例如富士通+甲骨文,富士通+英伟达)是现实路径,但仍受供应链影响;

数据获取与隐私法制:医疗/行政等高价值数据的可用性受隐私法规与伦理限制,需在“可用+合规”之间取得平衡。学界与政府的试点,正试图解决此类课题。

人才与生态:需要更多跨界人才(算法、工程、治理、伦理),以及长期经费支持以维持模型训练与更新。虽然学界与社区活动显示人才培养在进行中,但人才不足是长期的课题。

供稿 / 戴维
编辑 JST客观日本编辑部