|
段玉聪
一、背景与挑战
当今智慧医疗和健康数据领域面临语义割裂与治理失衡的严峻挑战。一方面,各类医疗AI系统常被视为“黑箱”,模型决策过程难以解释,导致医患对其诊断建议缺乏信任。例如,深度学习算法可以预测疾病风险,却无法清晰说明依据,引发对算法透明度和可解释性的质疑。同时,不同机构和区域间的健康数据缺乏统一语义标准,形成“数据孤岛”。由于法律、管理和技术标准缺失,我国医疗大数据共享效率不高、范围有限,数据冗余分散、系统重复建设。各医疗机构各自为政,不同厂商系统的数据接口格式不统一,元数据采集重复、数据粒度不一致,机构间数据难以交换共享。这种语义割裂导致健康数据和知识无法有效融通,阻碍了智慧医疗服务的一体化发展。
在此背景下,数据偏见与算法歧视问题愈发凸显。不加以规范,人工智能可能因训练数据不当而加剧健康不平等。例如主要基于高收入国家人群数据训练的模型,可能不适用于低收入环境,威胁弱势群体的患者安全。部分企业和机构对健康数据的不当攫取和利用,更使公众权益让位于商业利益。数字中医药领域同样面临语义鸿沟:中医强调症候、能量场等概念体系,而西医更偏重生物指标和证据,这两套语义系统缺乏对接,导致“数字中医”发展步履维艰。中医知识数字化过程中,若简单套用西医的数据框架,往往忽视中医“信息-能量场”等独特语义维度。这既造成中医药数据与现代医疗数据难以融合,也削弱了中医药知识体系的自主性。
针对上述难题,“语义主权”理念应运而生。语义主权是指国家有能力主导人工智能和数据的语义体系,确保本国话语体系和价值观在智能系统中得到体现。“语义主权”强调国家掌控AI语义层级和价值取向,避免AI输出有损国家主权和文化的内容,与欧洲倡导的数字主权以维护语义多样性的理念相呼应。在健康领域,语义主权意味着对医学数据标准、知识体系和AI决策逻辑的自主权:既保障国家健康数据安全,又构筑可解释、可信任的医疗AI治理框架,避免核心语义资源被他者控制。从国家安全和科技竞争看,语义主权有助于巩固健康数据主权,防止医疗大数据及其语义被滥用;从社会治理看,语义主权可赋予AI以道德伦理约束和语义透明度,增强公众对智慧医疗的信任;从学术文化看,语义主权保障本土医学知识体系(包括中医药)的独立性与延续性,对于构建自主可控的健康话语体系具有战略意义。
二、技术支撑路径为实现健康领域的语义主权治理,段玉聪教授团队提出了一整套技术体系作为支撑路径,包括DIKWP语义模型、“白盒”测评体系、语义区块链以及DIKWPaaS平台等。这些创新工具分别从语义表示、评估监管、可信存证和平台服务四个方面,为语义主权在医疗健康领域的落地提供了保障。
l DIKWP语义模型:DIKWP模型是在经典“数据-信息-知识-智慧(DIKW)”框架顶层引入“Purpose(目的/意图)”而形成的五层语义认知体系。五层分别对应数据 (Data)、信息 (Information)、知识 (Knowledge)、智慧 (Wisdom)和意图 (Purpose)。这一模型强调各层语义的双向反馈迭代,较高层的智慧和意图能指导低层的数据选择与加工,形成意图驱动的认知循环。通过嵌入“意图”维度,DIKWP模型突出了目标导向的重要性,使AI系统在决策时融入人类的目的和价值考量。每一步推理过程均可追溯和解释,形成共同的认知语义语言。正因如此,DIKWP语义模型为医疗AI提供了透明可解释的语义结构,确保算法决策始终服务于人类安全和伦理需求。
l 人工智能“白盒”测评体系:有别于传统只关注输入输出的黑盒测试,白盒测评对AI内部决策机制进行全链路解析。段玉聪教授团队构建的DIKWP白盒测评体系,基于上述五层认知模型,对AI模型在数据处理、信息提取、知识推理、智慧决策和意图识别各层面的能力进行评估。这一方法突破了仅侧重语义理解与推理的局限,可将模型认知过程分解到DIKWP五个环节逐一审视。例如,在“大语言模型识商白盒测评2025报告”中,该体系通过100道测试全面覆盖了主流大模型的感知处理、知识构建、智慧应用、意图理解等能力模块,对模型“意识水平”做了量化剖析。白盒测评让AI的认知弱点与偏差一目了然,为医疗AI算法的可信评估树立了新标杆。在医疗场景中,引入白盒评估可验证临床AI模型的决策合理性,确保算法在诊断、预测中的每一步都有据可依、可解释可控。
l DIKWP语义区块链:将语义技术融合进区块链,以保障健康数据共享的可信和可追溯。传统区块链只存储句法层面的数据记录,并不理解数据语义;而“语义区块链”旨在给链上数据赋予机器可解释的含义。段玉聪教授团队提出的DIKWP×DIKWP语义区块链框架,创新性地将每笔链上内容按照数据、信息、知识、智慧、意图五层结构化存储。每一层内容都有明确语义定义,并相互关联,记录从原始数据到高层智慧/目标的推演链路。举例而言,一条电子病历相关的链上记录,不仅包含原始检验数据,还可同时记录对这些数据的医学信息解释、提炼出的知识(如诊断结论)、相应的临床决策智慧,以及背后的意图(如治疗目标)。通过这种方式,链上数据从“不可解的黑盒”升级为“自描述的语义网络账本”。这使得不同医院或部门间共享患者数据时,接收方系统能自动理解数据所代表的医学含义,极大提升跨机构语义互操作能力。此外,语义区块链还支持对链上知识资产的确权和溯源,可将原始数据、衍生知识分别标记所有权或使用权。这为医学知识产权保护和数据治理提供了全新的思路,有望解决医疗数据共享中信任缺失和责任界定难题。
l DIKWPaaS语义平台:即“DIKWP平台即服务”(DIKWP as a Service),旨在将上述DIKWP模型的功能模块化、云端化,打造“一切皆DIKWP(XaaDIKWP)”的语义服务生态。DIKWPaaS平台内置强大的多语言语义分析与转换引擎,能够将不同语言、不同系统中的健康信息映射到统一的语义表示上。例如,对于英文的医学文献、中文的电子病历,平台可提取其中的医学概念并转化为标准化的知识图谱,再对应到目标语言或系统的语义环境中。这使得跨语种健康语义互操作成为可能:当国际医学信息进入国内语境时,DIKWPaaS充当“语义中枢”,一端理解外文资料的真实含义,另一端结合本土医学术语和监管语境进行对照翻译。除了语言转换,DIKWPaaS更重要的功能是消除跨部门、跨领域的信息壁垒。传统上,不同医院和机构的信息系统由于数据标准不一而难以互通;但借助DIKWPaaS平台提供的统一语义接口,各系统的数据可被动态对齐到共享的医学本体,实现政务医疗数据语义打通。通过标准API对接医院信息系统和患者个人App,DIKWPaaS充当所有健康应用背后的“语义翻译官”和“协同调度中心”。最终,它将医学数据、知识和服务进行语义层面的汇聚,形成“语义即服务”的国家健康语义云平台,为智慧医疗各环节提供统一的语义支撑。
上述技术体系共同构筑了医疗领域语义主权的实现路径。DIKWP模型及语义数学方法解决了医学知识图谱构建中的语义异构难题,使来自临床科研、公共卫生和中医药等多源知识能够融合为统一的医学语义网络。白盒测评体系为临床AI、疾病预测模型等提供了可信评估机制,确保这些模型在投入应用前经过充分的透明性和安全性验证。语义区块链技术保障了健康数据与知识交换的可追溯性和安全性,实现患者信息从数据采集到知识应用全过程的证据留存和责任界定。DIKWPaaS平台则作为国家医学语义中台,承载跨语种、跨系统的健康语义服务,使得医生、患者和管理者能够在同一语义体系下交流理解,实现患者知识对等理解的新模式。例如,通过健康教育和数据语义标注,患者可以理解自身检查指标所代表的意义,与医生在基础数据上达成共识,从而更积极地参与诊疗决策。这标志着医患双方迈向了知识对等的新阶段:患者具备知情权和语义理解力,医生获得来自患者的有效反馈,双方共同提升医疗决策的质量和可信度。
三、战略应用重点为将上述语义主权技术融入国家健康治理框架,我们建议在以下两方面重点推进战略级应用:
l 构建“国家医学语义中台”:依托DIKWPaaS平台和语义区块链技术,建设覆盖国家卫健委及各级医疗机构的医学语义中台。该中台作为全国健康知识图谱仓库和语义交换枢纽,统一不同地区、不同系统的医学数据标准,实现电子健康档案、医院信息系统与公共卫生数据库之间的语义贯通。同时,中台将汇聚中西医融合的医学知识体系,内置中医药语义本体和推理引擎,打造数字中医药语义平台,支持中医诊疗信息的结构化表达和智能推理。在政务服务上,医学语义中台可为医保、疾控、药监等部门提供标准化的数据接口,消除部门壁垒,提升决策效率。例如,基于中台打通医院电子病历和公共卫生系统的数据后,疫情监测、慢病管理等工作将更加及时精准。建议选择在医疗和信息化基础较好的地区(如海南自由贸易港、上海、广州、昆明等)先行开展中台试点建设,形成可复制推广的示范标杆。通过试点不断完善技术标准和运营机制,最终上升为国家级医学语义中枢,支撑全国范围内医疗数据的互联互通和智能服务。
l 设立“健康AI白盒测评体系”:由国家卫健委牵头,会同科技部等部门建立权威的健康人工智能白盒评估平台和制度,专门针对临床AI应用开展可信测评。测评体系应涵盖常见的医疗AI类型,包括影像诊断算法、疾病风险预测模型、手术机器人决策系统、中医辨证论治AI引擎等。评估内容采用DIKWP五层框架,既考察模型准确性,又关注其数据来源合理性、知识推理科学性、决策是否符合伦理意图等方面,真正打开AI模型的“语义黑箱”。建议将该测评体系纳入医疗AI产品监管流程,对高风险医疗AI实施第三方白盒测评认证。测评达标者方可进入临床使用,从制度上确保“带证上岗”。同时,建立健康AI测评结果数据库,定期公布模型的“可信成绩单”,供医疗机构采购和公众参考。在国家医学语义中台中部署白盒测评中心,为各地引入的医疗AI系统提供在线测评服务,实现监管事前准入与全周期监督相结合。这一举措将有效提升医疗AI算法的透明度和公信力,加速人工智能在医疗领域的安全落地应用。
四、国际对标与治理机制语义主权治理体系的构建需要放眼国际,在对标全球健康AI伦理准则的基础上凸显中国特色贡献。世界卫生组织(WHO)和经济合作与发展组织(OECD)近年先后发布了卫生领域AI伦理与治理的指导文件。例如,WHO在2021年《卫生领域人工智能伦理和治理》报告中提出了六项原则,强调必须将道德和人权置于AI设计和使用核心,包括保护人类自主权、促进福祉安全、保障透明可解释、问责机制、包容公平和可持续性等。这些原则针对的正是当前医疗AI发展中存在的风险:如未经同意的数据利用、不公平的算法偏见、黑箱决策缺乏解释以及潜在的伦理滥用等。OECD也发布了面向AI的一系列治理原则,倡导以人为本、值得信赖的AI,要求AI系统在透明、公平、责任和数据安全方面满足标准,以增强公众信心。可以看到,国际共识普遍要求医疗AI在可解释性、非歧视性、透明问责等方面做出改进。然而,目前多数指南停留在原则倡议层面,可操作性相对有限。我国构建的语义主权治理体系,有望将这些伦理原则转化为技术实现和制度保障,为全球健康AI治理提供新的思路。
首先,在数据主权方面,中国的语义主权框架强调国家对健康数据语义体系的主导权,确保AI算法内嵌本国的价值观和战略意图。这一点超越了WHO仅强调数据隐私和知情同意的层面,而是从自主语义标准上保障发展中国家的数字权益。例如,通过DIKWP模型,我们可以把国家提倡的医学伦理准则(如“不伤害”“知情同意”)转化为AI内部的决策约束,让算法“懂得”中国医德和监管要求,从根源上避免算法输出违背本国伦理和主权利益的结论。其次,在语义可解释性方面,语义主权体系提供了具体的工具(如白盒测评和语义区块链)来落实AI决策过程的透明可追溯。例如利用语义区块链记录AI诊断推理的每一步语义证据,实现知识追溯和责任界定,填补了OECD原则中对AI如何实现问责的技术空白。再次,在伦理透明方面,DIKWP模型将“目的/意图”作为最高层,使AI系统能够明确地表示其决策所服务的最终健康目标或伦理考量。这意味着医疗AI不再是冷冰冰的黑箱计算,而是可以说出“为何这样做”,其决策逻辑和价值判断对监管者和公众都是开放的。相比之下,国际上对AI伦理的要求大多缺乏这种语义层级的细化设计。中国的语义主权体系在全球率先把伦理要求嵌入AI语义结构中,提供了实现WHO/OECD倡导的透明、公平原则的全新路径。
为巩固我国在该领域的引领地位,我们应同步完善标准规范与治理机制建设,推动语义主权上升为国家和国际层面的制度安排。首先,尽快构建“健康领域语义主权”国家标准体系,制定涵盖语义评估、知识溯源、可信对话等方面的系列标准规范。例如,研制《医疗AI语义透明度评估规范》、《健康知识图谱语义标注标准》、《医患对话语义理解与响应技术指南》等标准文件,将语义主权理念转化为可操作的行业准则。在监管层面,建立语义治理审查机制,在医疗AI产品准入、医疗大数据跨境流动等环节引入语义安全评估,确保AI系统的语义输出符合国家法律和伦理要求。对于临床决策支持等高风险AI,引入独立的第三方机构依据白盒测评结果出具认证,成为监管部门审批和临床准入的重要依据。同时,加强部际协调,建议由国家网信办、卫健委、标准化管理委员会等共同成立语义主权标准工作组,将海南等地试点形成的成功经验上升为国家标准乃至法律法规。在国际治理层面,中国应积极倡导多边合作:例如牵头组建“全球语义治理合作网络”,与WHO、ITU等机构合作推动语义互操作、AI白盒评测等方面的国际标准制定。通过输出中国主导的语义主权标准和治理方案,为全球数字健康治理贡献“中国智慧”和制度供给,提升我国在国际卫生科技治理中的话语权。
五、政策建议l 将“健康语义治理”纳入国家战略规划。建议在编制《国家智慧健康发展规划(2026—2030)》时增设“健康语义主权”专章,明确语义标准化与语义安全作为智慧健康的重要基础。规划应涵盖医学语义中台建设、健康数据语义标准制定、医疗AI语义安全监管等任务,将语义治理提升到国家战略高度统筹推进。
l 设立“健康语义主权”国家重大专项。由科技部会同国家卫健委启动跨部门的重大科研专项,集中攻关健康语义关键技术与标准研制。专项重点支持DIKWPaaS国家医学语义中台、医疗知识图谱与本体库、白盒测评工具、语义区块链应用等平台型项目研发,夯实语义主权的技术底座。通过该专项引导国内高校、科研院所和企业协同创新,加快相关专利成果转化,形成自主可控的健康语义技术体系。
l 开展国家医学语义中台试点示范。选择海南、上海、广州、昆明等数字健康基础较好的地区,先行建设区域级医学语义中台并投入应用。通过试点验证语义中台在政务数据共享、医院电子病历语义治理、中医药AI平台等场景的成效,完善运营机制与安全保障措施。中央给予试点地区政策和资金支持,鼓励其大胆探索,在数据确权开放、语义标准落地、跨机构协同治理等方面积累经验。一旦条件成熟,在全国范围内推广部署医学语义中台,实现东、中、西部语义互通,推动健康数据资源高效流动和价值释放。
l 主导制定“语义驱动医疗AI白盒评估”标准并参与国际规则。由中国主导提案,联合有意向的国家,在ISO或ITU等平台上共同制定《语义驱动的医疗AI白盒评估规范》,明确医疗AI模型在数据语义一致性、知识可解释性、决策透明度等方面的评测指标和方法。同时积极参与WHO和IEC框架下医疗AI相关标准工作,将语义主权理念融入国际标准文本。在“一带一路”数字健康合作中倡议成立**“全球健康语义治理联盟”**,推广我国语义评估标准,开展跨国语义互操作试点,形成共识机制。在国际AI治理议题上发出中国声音,确保未来全球医疗AI伦理规则制定中包含语义主权维度,实现技术标准与伦理治理的协同演进。
综上所述,构建健康领域“语义主权”治理体系既具前瞻性又切实可行。通过技术创新与政策引导双管齐下,我国有望率先走出一条语义安全可控、知识自主共享、智能可信惠民的数字健康发展道路。在保障国家数据主权和文化安全的同时,这一体系将为智慧医疗注入新的动能,助力“健康中国2030”目标的实现,并为全球健康治理贡献独特的“中国方案”。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-7-7 01:08
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社