|||
数据化:一切皆可“量化”
信息技术变革随处可见,但是如今的信息技术变革的重点在“技术”上,不在“信息”上。
大数据最早实践之一的莫里导航图向我们说明远在信息数字化之前,对数据的运用就已经开始了。很多事例表明,数据可以从最不可能的地方提取出来。但这里应该区分两个概念,“数据化”和“数字化”。数据代表着对某件事物的描述,数据可以记录、分析和重组它。我们总是把数据化当成数字化,两者是完全不同的概念,数据化是指把现象转变为可制表分析的量化形式的过程。而数字化是指把模拟数据转换成用0和1表示的二进制码,这样电脑就可以处理这些数据了。书中举了个例子来帮我们理解这两个概念,谷歌在2004年的时候,开始将所有版权允许的书本内容进行数字化,即将每一页都被扫描,然后存储在服务器的一个高分辨率数字图像文件中。书本上的内容完成了网络上的数字文本,方便了人们的查阅,但是它不能做到根据关键词来搜索自己感兴趣的内容,因为这些数字文本没有被数据化,谷歌拥有的只是一些图像,因此,谷歌使用了能识别数字图像的光学字符识别软件来识别文本中的字,如此一来,书页的数字化图像就转化成了数据化文本。
一旦世界被数据化,就只有你想不到,而没有信息做不到的事情了。在大数据时代,惊喜无处不在!我最喜欢这句话。回头我们生活中大数据的例子,你总是会惊讶的发出赞叹,好棒!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-6 06:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社