maohelu的个人博客分享 http://blog.sciencenet.cn/u/maohelu

博文

大数据时代(6)

已有 3310 次阅读 2016-11-16 17:30 |个人分类:读书笔记|系统分类:科研笔记| 大数据时代

“取之不尽,用之不竭”的数据创新

我们所处的时代之所以与众不同,是因为数据的收集不再存在固有的局限性。大量信息可以被廉价地捕捉和记录,数据经常会被动地收集,人们无须投入太多精力甚至不需要认识这些数据。而且,由于存储成本的大幅下降,使得以较低成本获得更多数据的可能性较大。

数据再利用:不同于物质性的东西,数据的价值不会随着它的使用而减少或有所损耗,而是可以不断地被处理。而且个人的使用不会妨碍其他人的使用。数据的价值不限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其他目的。判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。很多互联网和科技公司甚至直到最近才知道数据再利用具有多大的价值。

数据重组:如今,互联网用户都熟悉基本的混搭式应用,即将两个或多个数据源以一种新颖的方式结合起来。例如,房地产网站将房地产信息和价格添加在美国的社区地图上,同时还聚合了社区近期的交易和物业规格等大量信息,以此来预测区域内具体每套住宅的价值。

数据的折旧值:随着时间的推移,大多数数据都会失去一部分基本用途。在这种情况下,继续依赖于旧的数据不仅不能增加价值,实际上还会破坏新数据的价值。但潜在价值的概念表明,组织机构应收集尽可能多的使用数据并保存尽可能长的时间。保存并不代表每种用途要全部用,要用复杂的算法将一些折旧数据剔除掉,这样才能保证结果的准确性。

数据开放:这个就不多说了,看到标题就知道要说什么了。中国很难迈出的一步。



https://wap.sciencenet.cn/blog-916405-1015128.html

上一篇:大数据时代(5)
下一篇:GIS中的热力图
收藏 IP: 27.223.77.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-4 08:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部