|||
朱杨勇主编的《大数据资源》于2018年由上海科学技术出版社出版。本书共分为11章。
第1章 绪论
数据开发的6用问题:数据不够用、数据不可用、数据不好用、数据不会用、数据不敢用、数据不能用。
第2章 政府数据资源
数据开放和数据共享是两个概念。数据开放是指数据拥有方将原始数据向全社会进行开放,任何团体和个人都可以进行下载、利用和开发。
数据共享是指合作双方或多方之间进行相关数据的共享利用和开发,包括政府部门之间、跨行政区域政府间、政府与企业间以及企业事业单位之间的都可以进行数据共享。
第3章 科学数据与资源共享
科学数据资源主要包括(1)通过长期观测、试验所获取的描述事物现象、分布格局与变化过程数据。(2)通过科学考察、调查所获取的描述事物现象的情境数据。(3)通过试验、测试分析所获取的描述物体特征的数据。(4)科技应用、研究活动中所产生和积累的具有科学价值的数据和相关信息。
一般而言,科学数据的采集与生产方法主要有普查、抽样调查、科学实验和观察记录4种方法。
第4章 农业数据资源
农业领域数据资源的主要获取方法有购买、互联网查询或爬取、数据接口获取、专业信息采集体系、物联网采集、遥感采集、地理信息系统、调查法、人工采集。
第5章 制造业大数据资源
第6章 金融数据资源
第7章 交通数据资源
第8章 能源大数据资源
第9章 医疗数据资源
第10章 数据质量
数据质量是指在业务环境下,数据符合数据消费者的使用目的,能满足业务场景具体需求的程度。
数据质量评价方法主要分为定性方法、定量方法和综合方法。综合方法包括层次分析法、模糊综合评价法、云模型评估法和缺陷扣分法。
第11章 大数据治理
大数据治理是对组织的大数据管理和利用进行评估、指导和监督的体系框架。它通过制定战略方针、建立组织结构、明确职责分工等,实现大数据的风险可控、安全合规、绩效提升和价值创造,并提供不断创新的大数据服务。
大数据治理实施的关键要素,包括实施目标、企业文化、组织架构和岗位责任、标准规范、合规管理和控制。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-15 18:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社