世间唯变化永恒...分享 http://blog.sciencenet.cn/u/zlhua 世间唯变化永恒,以开朗的心简洁地生活...

博文

垃圾信息太多怎么办?——GB/T 35304-2017统一内容标签格式规范

已有 2234 次阅读 2021-10-24 18:33 |个人分类:智慧新世界|系统分类:科研笔记

小拓:最近学生反映《信息科学原理课》老师布置的作业太恼火了,网上都搜不到标准答案,作业相关的信息太难搜寻了,好多垃圾信息,作业要花好多时间。

大智:以前了解过统一内容标签格式规范(Uniform content label format spcification)么?

小拓:统一内容标签?

大智:是的,统一内容标签格式规范,简称UCL,是我国东南大学、新华通讯社、国家新闻出版广电总局、清华大学、大有数字资源有限公司和北京大学起草,2017年12月29日发布的国家标准GB/T 35304-2017,2018年4月1日实施。

小拓:UCL,名字感觉和URL很像~

大智:呵呵,你的感觉是对的。这个标准就是针对URL的缺陷提出来的,旨在全面支持网络空间中内容大数据的共享和治理。

小拓:针对URL的缺陷?

大智:URL是统一资源定位符Uniform Resource Locator的英文简称。目前是互联网中基础性、核心性和通用性的内容标识标准。现在互联网的内容资源普遍都采用了URL进行标识。

小拓:他们具体发现了URL的什么缺陷?

大智:  URL是面向地址理念设计的,原理上无法描述内容资源的丰富语义信息,也难以支持基于语义的内容组织和管理,因此虽然很多时候,我们明明知道知道互联网就是一个大宝库,但面对内容资源难找难管,难以甄别和筛选等问题,着实头疼。

小拓:所以那些同学头疼得很,他们一般只要老师布置了作业就会条件反射的使用百度搜索引擎,结果发现《信息科学原理》课程布置的作业真的很难在网上搜到标准答案,搜到自己想要的信息也很困难。

大智:现在,我们就用百度和必要这两个目前国内网民比较常用的搜索引擎搜寻下“统一内容标签”主题相关的信息。

1.用“统一内容标签”在必应国内版搜寻的相关信息

GB T 35304-2017_统一内容标签格式规范_高清版_可检索.pdf (book118.com)

统一内容标签格式规范-GB/T 35304-2017-安全管理网 (safehoo.com)

国家标准《统一内容标签格式规范》介绍-《中国传媒科技》2018年02期-中国知网 (cnki.net)

【科技日报】《统一内容标签格式规范》出台 (seu.edu.cn)

GB/T 35304-2017 统一内容标签格式规范 (免费下载) - 标准网 (biaozhuns.com)

2.用Uniform content label必应国际版搜寻的相关信息

2774353 - Production Date Missing in Uniform Content Label (sap.com)

Form template "Uniform content label" and CODE 39 barcode type | SAP 

3.用“统一内容标签”在百度搜索到的相关信息

统一内容标签_百度百科 (baidu.com)

【科技日报】《统一内容标签格式规范》出台 (seu.edu.cn)

GBT 35304-2017 统一内容标签格式规范.pdf-原创力文档 (book118.com)

国家标准《统一内容标签格式规范》介绍 - 百度文库 (baidu.com)

GBT 35304-2017 统一内容标签格式规范 - 道客巴巴 (doc88.com)

小拓:国际上的都是和SAP相关的,而且信息比较少,不像国内信息那么多。

大智:从搜索引擎提供的信息来看,你觉得哪个更好用?

小拓:这个主题的话,必应的好像信息内容和形式更丰富一些。

大智:无论是必应还是百度,这些搜索引擎都是基于URL提供的信息。

小拓:是的,每个页面都有一个URL

大智:URL分动态URL和静态URL,如果以前是动态URL,后面改成静态页面,就要去替换成静态URL。URL标准化是什么,如何做URL标准化 - 知乎 (zhihu.com) 而且在搜索过程中,不难发现,看似有些内容很多页面都有,但你真的想搜寻一个比较靠谱的具体内容时,但是会跳出来很多页面,质量良莠不齐,很难甄别和筛选。

小拓:那倒是,不过已经习惯了...难道UCL可以帮助网民更快的找到高质量的信息?

大智:UCL标准引言里专门提到了:“本标准是针对URL 的缺陷而提出,旨在全面支持网络空间中大数据的共享和治理。统一内容标签UCL(Uniform Comten Label)体现了内容驱动的全新设计理念,它贯穿内容的生产、消费和管理等关键环节,形成三位一体的网络空间内容大数据创新标识体系。”

小拓:大数据、内容驱动、内容生产、消费和管理、三位一体...具体怎么实现的呢?

大智:统一内容标签可以从多个维度描述内容资源的特征,支持内容资源的认证、注册及追溯,结构灵活并允许按需裁剪和自由扩展。

小拓:这里的内容是指什么意思?记得钟义信先生的认识论层次定义中将信息划分为语法信息、语义信息和语用信息三个层次,这里的的内容是不是指的第二个层次,属于语义信息的范畴?

大智:一开始我也是这么理解的,因为前面提到了URL的缺陷——原理上无法描述内容资源的丰富语义信息,也难以支持基于语义的内容组织和管理。

小拓:所以才会出现刚刚我们发现的,本来想快速找到内容,但是现在基于URL的搜索会跳出来很多页面,质量良莠不齐,要花很多时间甄别和筛选?那UCL为什么可以帮助网民更快的找到更高质量的语义信息层次的内容?有没有基于UCL的网络搜索引擎?

大智:刚刚在标准起草单位看到了一个叫大有数字资源有限公司,可能是一个技术支持公司。可以具体搜索看~

小拓:真的可以搜到,志存高远,大有可为 ——大有数字资源有限责任公司 (dayou.com.cn) 有大有集团、大有云、大有资源、大有服务、大有信息。基于UCL的大有网络搜索引擎到底在哪里呢?







https://wap.sciencenet.cn/blog-520919-1309277.html

上一篇:跨越时空的对话 ——数字人民币、共识机制与时间的秩序
下一篇:最优传输是不是学习?
收藏 IP: 117.136.65.*| 热度|

2 李宏翰 陈新平

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 20:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部