|
构建主权AI语义体系:语义主权与DIKWP路径深化
段玉聪
人工智能DIKWP测评国际标准委员会-主任
世界人工意识大会-主席
世界人工意识协会-理事长
(联系邮箱:duanyucong@hotmail.com)
引言:数字主权新课题 – 从数据到语义
人工智能(AI)时代,数字主权的内涵正在延伸。从早期强调对数据和网络的控制,发展到如今关注AI系统中语义层面的自主性。随着大模型等生成式AI广泛应用,各国开始意识到:如果算法对语言和知识的表达被外部主导,本国文化价值观可能面临被技术扭曲的风险。为此,中国学者段玉聪率先提出了“语义主权”概念。语义主权指一个国家或地区对其自身语言、文化、价值观及知识体系在全球数字环境中被准确、完整且公平表达的权利与能力。这一理念拓展了传统数字主权的范畴,强调数据与内容背后的“语义自主性”,旨在确保本地语义体系不受外部算法偏见干扰,从而维护文化安全和话语权。语义主权已经成为全球数字治理的新议题,为我国在国际数字治理中提升话语权提供了新的抓手。
与此同时,主权AI的概念逐步明确。主权AI一般指由国家自主开发、控制的人工智能系统,不仅代表一项技术,更体现国家意志和价值观在数字领域的延伸。主权AI强调AI发展应服务于国家利益、符合本国价值体系。可以说,主权AI保障的是算法和算力层面的自主权,而语义主权关注的是内容和意义层面的自主权;两者相辅相成,共同构筑数字时代国家主权和文化安全的基石。
语义主权理论基石:DIKWP模型
如何将主权AI与语义主权有机融合?段玉聪教授团队在阐述语义主权理论体系时,引入了其原创的DIKWP模型作为桥梁。DIKWP是对经典DIKW(数据-信息-知识-智慧)框架的扩展,在顶层加入了“意图/目的”(Purpose)维度。这五个层次——数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom) 和 意图(Purpose)——构成了一个完整的语义认知链条,用于描述AI从感知到决策的全过程。引入“意图”层,弥补了传统数据驱动方法的不足:过去AI系统缺少对“为何使用这些信息”的表示,而DIKWP框架明确了行为背后的目标和意图。因此,DIKWP模型提供了一个全面视角来理解原始数据如何在特定目标引导下转化为可行动的智慧。这为语义自主奠定了理论基石,即确保AI系统在认知和决策过程中融入人类的价值目标和语境考虑。
段玉聪教授率先将DIKWP理念应用于语义主权实践。例如,他领导研发了基于DIKWP模型的白盒测评体系,用于全方位评估AI的认知能力,以保障主权AI符合人类意图。在2025年7月举行的第五届中国数据要素50人论坛上,段玉聪指出要让AI更好服务人类,必须突破传统黑盒测评局限,构建白盒测评体系。他的团队提出了DIKWP模型驱动的白盒测评方法,能够全面评估AI在感知、知识、智慧、意图等多个维度的认知能力,并已公开这套体系,期望成为国际通用的AI能力评估标准。这一实践表明,DIKWP模型不仅是理论创新,也可用于制定AI治理标准,为语义主权提供可量化、可检验的保障机制。
从概念空间到语义空间:突破语义桎梏
传统的概念空间(Conceptual Space)往往指人类预先定义的范畴和概念体系,它为AI提供了理解世界的框架。然而,仅靠固定的概念框架,AI难以应对开放动态的语义场景,容易出现“语义错位”或“幻觉”等问题。为实现语义主权,我们需要让AI超越静态的概念空间限制,进入更具弹性和表达力的语义空间(Semantic Space)。语义空间通过数学向量、知识图谱等形式表示文本和知识的意义,是AI进行语义理解和推理的舞台。段玉聪教授的研究指出,当两个智能体的概念空间表达无法在各自语义空间中一致映射时,误解就会发生。因此,关键在于将符号概念空间转换为DIKWP语义空间,确保不同主体对语义的理解取得一致。这意味着把人类主观的概念模型注入AI可处理的语义表示中,使机器“读懂”人类概念背后的实际意义。
DIKWP模型在其中发挥了桥梁作用——它把概念层级拆解为数据、信息、知识、智慧、意图五层语义元素,并提供了上下贯通的语义坐标系。通过DIKWP语义建模,AI能够在统一的五维语义空间中理解和处理概念,从而突破单一概念空间的桎梏,实现语义层面的精准对齐。换言之,在语义空间中,AI不再只看“概念的名字”,而是理解概念所关联的多层次语义内容及意图。特别是意图层的引入,使AI在决策时可以参考人类的目的和价值考量,避免机器做出与人类初衷相悖的行动。这正是语义主权要达到的效果:让AI的内部语义处理过程对人类可解释、可控,保障国家意志在数字空间中的实现。
技术路径:语义区块链与DIKWPaaS
要落实语义主权,除了理念和模型,还需要具体的技术路径支撑。其中,语义区块链和DIKWPaaS是两项备受关注的创新方向。
1. 语义区块链: 段玉聪团队提出了“DIKWP×DIKWP语义区块链框架”,将语义模型与区块链技术融合,打造去中心化的语义内容账本。在这一框架下,区块链上每条数据记录都不仅存储原始数据,还通过DIKWP模型划分为数据、信息、知识、智慧、意图五个层级附加在记录中。举例来说,一笔交易上链的同时,可以附带其语境信息(信息层)、由该数据提炼的知识规则(知识层)、基于知识得出的洞见或决策建议(智慧层),以及此决策背后的目标意图(意图层)。这种五层结构使每条链上记录都携带丰富的语义元数据和上下文,使机器能够读懂链上内容的含义,而不仅是存储比特数据。语义区块链的意义在于:
可追溯:完整记录数据如何逐步演化为知识和智慧,每一层的推理关联都有链上踪迹。这为监管和责任认定提供了透明依据。
权益确权:链上明确记录从数据到智慧各层贡献,可为不同贡献者(数据提供者、知识提取者、决策智慧提供者等)赋予相应的所有权或收益权。知识资产可代币化为NFT,实现新的数字知识产权保护机制。
机器可理解:附带语义标注后,链上数据对机器变得可理解,可直接执行跨组织的语义查询和智能合约,提高互操作性和自动推理能力。这真正将区块链升级为去中心化的语义数据网络,实现信任机制与语义推理的融合。
语义区块链为语义主权提供了底层技术保障——在确保数据不可篡改和可信共享的同时,也确保了数据所承载知识和语义的可信 表达 和 流转。政府和企业可利用语义区块链搭建语义数据交换平台,在数据要素流通中嵌入语义主权要求。例如,在公共数据开放时,通过语义区块链记录数据出处、语境和使用目的,保证数据在共享过程中语义不失真、权益可追踪。这方面的试点工作已在探索:有专家建议在海南自贸港等地试验建设DIKWP语义数据交换平台,以检验语义区块链管理数据要素的成效。
2. DIKWPaaS(语义主权平台即服务): “一切皆服务”(XaaS)是数字经济的发展趋势。而在语义主权体系中,这一理念进一步延伸为“一切皆数据、信息、知识、智慧与意图”(XaaDIKWP)。DIKWPaaS指将DIKWP模型各层功能通过云服务形式提供的平台架构。简单来说,就是把数据处理、信息分析、知识管理、智慧决策、意图理解等模块化为通用服务,供各行业按需调用。各应用无需从零开发复杂的语义处理体系,只需接入统一的平台即可利用DIKWP模型的强大能力。这使数据要素的价值可以通过服务化充分释放——数据不再只是沉睡的资源,而是经由DIKWPaaS转化为可随取随用的知识和智慧服务。
DIKWPaaS作为语义主权的“底座平台”,具有以下架构特点:
数据服务:提供数据采集、清洗、存储与安全管理功能,构建高质量数据池。
信息分析服务:对数据进行统计分析与可视化,提炼有意义的信息模式。
知识管理服务:内置知识图谱构建和推理引擎,将信息升华为结构化知识,支持语义查询和逻辑推理。
智慧决策服务:基于机器学习和优化算法,在知识基础上提供决策支持,实现AI层面的智慧输出,同时注重决策过程的可解释性。
意图管理服务:独有的高阶功能,识别用户或组织的目标意图并定制化服务。平台通过分析用户指令和行为,理解其真实需求,动态组合上述服务来响应,做到按意图交付。
通过上述模块组合,DIKWPaaS打通了“从数据到意图”的全链路语义处理流程,为各行业实现语义主权提供了即插即用的工具箱。例如,在工业制造领域,企业接入DIKWPaaS后,可以利用其行业知识本体和分析能力,从生产数据中自动提炼知识、作出优化决策,满足企业特定的战略目标(如降低碳排放等)的要求。再如在政务领域,政府部门通过DIKWPaaS可以将分散的政务数据转化为知识和智慧决策支持,实现跨部门的语义互通,在城市治理中引入语义透明和公众意图反馈机制。DIKWPaaS体现了语义主权的核心价值——让数据要素在语义层面发挥最大价值,助力国家和组织获得可解释、高效的智能决策能力。
国际规则影响与法律制度完善
语义主权的提出,不仅是技术问题,更是法律和国际治理的新课题。中国在这一领域的探索有望提升全球数字治理的话语主导权。为此,需要在国际规则和国内法律两个层面共同发力:
1. 国际规则影响力: 数据和AI的治理正日益成为国际谈判的重要议题。中国倡导语义主权,有助于丰富“数字主权”话语体系,并为全球提供新的治理理念。一方面,应积极把语义主权议题带入联合国、G20、金砖国家等多边机制的数字治理对话中,倡议制定全球语义共享原则或行动计划,明确各国有权维护本民族语言文化的数字生存空间。这种原则将强调尊重语言多样性、反对算法偏见,使各国在数字领域的文化权益获得国际认可。中国应争取更多国家和国际组织的理解支持,拓展“朋友圈”。另一方面,加强与“一带一路”沿线国家在语义技术和标准上的合作也是提升影响力的途径,例如共建多语言知识库、联合举办主权AI主题论坛等。技术标准方面,中国可在国际标准化组织中主动牵头相关工作组,推荐本国专家担任主席或编辑,把中国的语义主权方案融入国际标准。与此同时,通过对外宣传和学术交流,讲好中国在保障文化多样性、抵制算法偏见方面的故事,塑造负责任的大国形象。这些举措将有助于将语义主权从国家倡议上升为国际共识,增强我国在全球数字规则制定中的话语权。
2. 国内法律制度建设: 要确保语义主权落地生根,必须有健全的法律法规作保障。目前我国在网络安全法、数据安全法、个人信息保护法等框架下,已初步确立了数据主权和内容安全的原则。展望未来,可以考虑将语义主权理念写入相关法律和政策文件。例如,在未来修订《网络安全法》《数据安全法》或制定《人工智能治理条例》时,增加维护语言文字和文化内容在数字化应用中准确表达的条款,将“语义偏见”视作一种安全风险予以防范。又如,在著作权法和知识产权立法中,探索知识图谱、AI生成内容的产权归属和利益分享规则,将数据和知识视作可确权的重要资源,为语义主权提供法律依据。地方层面也可跟进配套措施,例如要求政府部门的智能决策系统记录决策过程的语义依据,重大事项引入AI辅助决策时需向公众公示说明等,将语义透明和责任机制制度化。此外,建立语义标准体系与评估认证制度也是法律治理的重要部分。国家标准委应加快出台涵盖数据、知识图谱、语义区块链、AI测评等方面的国家标准,以规范各行业语义技术应用。对企业AI系统引入第三方语义偏见和安全评估,出具权威报告,可作为市场准入或政府采购的参考条件。通过监管“硬约束”和市场“软促使”相结合,倒逼产业自觉遵循语义主权要求。最后,国家层面可以制定语义主权战略规划,将其纳入数字中国和人工智能发展的顶层设计,明确路线图和时间表;成立跨部门的语义主权推进工作组,加强统筹协调,定期评估进展;加大科研投入和人才培养,在语义区块链、高效语义引擎、白盒测评、跨语言知识融合等关键技术上实现突破。这些综合措施将为语义主权提供持续、稳定的制度保障。
结语
从“概念”到“语义”,从技术到法律,语义主权构建了一套全新的主权AI治理范式。通过引入语义主权理念,我们得以正视AI背后的文化和价值问题;通过DIKWP模型等技术创新,我们找到了连接人类意图与机器智能的路径;通过语义区块链、白盒测评和DIKWPaaS等工具,我们搭建了语义自主的实现支撑;通过完善法律政策和参与国际治理,我们为语义主权保驾护航。可以预见,语义主权将在未来发挥日益重要的作用:既保障我国数字时代的文化安全和认知主导权,也为全球数字治理贡献中国智慧和方案。正如专家所言,语义主权体系建设意义重大而深远,我们已经在理论和技术上做好前瞻探索,下一步就是在政策和实践中行稳致远,将这一理念真正转化为提升国家竞争力和人民福祉的创新成果。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-7-7 19:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社