|
融合BERT和阻塞过滤的国家电网公共数据模型实体映射技术
李雨霏1,郝保聪1,楼轶维2*,杨诗语1,高士杰3,张鹏宇1
1. 国家电网有限公司大数据中心,北京100053
2. 北京大学计算机学院,北京100871
3. 北京中电普华信息技术有限公司,北京100085
摘要 针对目前国家电网公共数据模型SG-CIM(state grid-common information model)难以实现自动更新迭代和挖掘新元素效率较低等问题,提出了一种基于知识图谱和BERT(bidi⁃rectional encoder representations from transformers)模型的SG-CIM模型自动映射技术。在现有SG-CIM模型的基础上,构建出SG-CIM知识图谱和数据表知识图谱;通过研究基于BERT模型和阻塞过滤的实体映射技术,在2个知识图谱之间建立映射关系;对文本方法映射效果进行实验分析,结果表明在自制数据集上微调后BERT模型的精确度在88%以上。
关键词 知识图谱;SG-CIM模型;BERT模型;阻塞过滤;实体对齐;实体映射
(责任编辑 刘志远)
http://www.kjdb.org/CN/Y2023/V41/I15/113
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-18 14:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社