“除了上帝,任何人都必须用数据来说话”
——美国谚语
今天是一个大量数据公之于众的时代,发达的科技为数据的收集和管理提供了极大支持。同时,数据的影响越来越深远地渗透到这个时代,并在信息社会和公民社会的背景下发挥着越来越大的作用。数据的收集和公开成为公民检验政府作为的标准,数据的规律和变化成为市场经济发展和平衡的尺码,当今社会的方方面面都经受着“大数据时代”带来的新冲击和新变化。《大数据》一书以数据为轴线,以美国走过的开放创新之路为代表,介绍了“大数据时代”从20世纪以来加速发展的历程,并结合美国、英国等西方国家在数据革命方面的实践,阐述了数据革命浪潮下社会价值观的变动和民主政治模式的创新,提出了当今中国在新时代面临的新挑战。
本书作者涂子沛,江西吉安人,著名科技作家、信息管理专家。毕业于卡内基梅隆大学,系微软认证高级程序员,曾居美国硅谷。先后担任中国旅美科技协会副主席、中国旅美科技协会匹兹堡分会主席,在国内担任上海真爱梦想公益基金会理事、中国人民大学中国调查与数据中心客座研究员等兼职。2014年12月任阿里巴巴副总裁。代表著作有:《大数据》、《数据之巅》等。以下对该书的主要章节和主要观点进行摘录:
历史的争战:《信息自由法》
美国总统奥巴马在就任当天就对外宣布:“我的这届政府将致力于建设一个前所未有的开放政府。我们将共同努力,以确保取得公众的信任,建立起透明、公众参与和多方合作的制度。”这彰显了奥巴马建立透明的、开放政府的决心,而这就意味着政府需要利用最新的技术来推进信息公开,而不是等待公众的查询。
事实上,在美国200多年的历史河流中,一直贯穿着对于信息的作用展开的思考与辩论。美国第3任总统托马斯·杰斐逊说:“信息之于民主,就如货币之于经济。”美国的信息公开从早期在国会的集中逐渐向新闻界开放,并从20世纪50年代以来拉开了波澜壮阔的信息公开运动。二战结束后,美国报纸编辑协会成立了“世界信息自由委员会”,但对限制信息自由的斗争一度困难重重。直到《信息自由法》的颁布及其在实施前经历的长达十余年的波折,越来越多关于信息公开的法律开始生效,美国政府对新闻的管制和人民拥有信息自由的打压受到有效阻碍。
数据帝国兴起:大数据时代的到来
信息的多少以物理存储器上保存的数据量作为度量,近几十年来科学家定义的新存储单位不断升级,从早期的位(Bit)、字节(Byte,8位)到大家熟知的兆字节(MB,220字节)、吉字节(GB,230字节),直至拍字节(PB,250字节)和艾字节(EB,260字节)。一个艾字节的信息量相当于13亿中国人人手一本500页的书加起来的信息总量,而研究报告显示,美国联邦政府共拥有将近一个艾字节的信息量。庞大的数据量印证了摩尔定律:同一个面积集成电路上可容纳的晶体管数目,一到两年可增加一倍。计算机硬件的飞速发展使海量数据的积累成为可能。政府大规模地收集数据、使用数据,是自古以来全世界的政府都在普遍采用的做法。美国的联邦政府作为信息中枢,正是见证数据帝国兴起的地方。
早在1980年代,美国就有人提出了“大数据”的概念,近年来各个领域的数据量都在迅猛增长,“大数据”这个名词变得越来越流行、越来越重要,最后成为了国家和政府层面的发展战略。因为数据之“大”意味着人类可以“分析和使用”的数据在大大增加,通过这些数据的变换、整合和分析,人类可以发现新的知识、创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。因此,大数据将成为全世界下一个创新、竞争和生产率提高的前沿。
数据治国之路:信息的利用和公开
美国这个国家虽然年轻,但相信数据、使用数据却有着深厚的传统,数据被视为科学的度量和知识的来源。近年来随着大数据的迅猛增加,各个政府部门都在尝试“用数据来决策”、“用数据来管理”、“用数据来创新”。美国是全世界第一个全面普及汽车的大国,一度被称为“车轮上的国家”,但随着汽车的增多,道路交通事故也随之增多,成为一个突出的公共问题。美国的交通安全管理局(NHTSA)运用循“数”管理的方法实现了交通事故死亡人数的大幅下降。该局建立了一套“交通事故死亡分析报告系统”,找到了交通事故发展的规律,同时通过互联网公开发布其收集的数据。更多的问题被发现,更好的方案被激发,各个州之间也能进行“事实对比”,形成了一种良性的“政策竞争”氛围。
在美国,和政府做生意的公司有一个专门的名称:政府合同商。它们通过承接政府的项目,赚国家的钱,因此联邦政府对其执行有别于一般企业的要求。诸多要求中的一项,就是“平权措施计划”。政府合同商向联邦政府提交全部员工的信息,包括性别、种族和收入变化等,一旦被发现有潜在的歧视问题,政府就会对该公司作出警告或处罚。但如果有第三方按照《信息自由法》对联邦政府提出要求,政府是否应该公开这些信息资料呢?著名的克莱斯勒诉布朗案即是“平权措施计划”及《信息自由法》的标志性案件,最高法院认定政府有权公开也有权不公开企业的商务机密,这使得《信息自由法》正式成为商业公司竞争的工具。
数据帝国法则:数据的收集和管理
美国是个法治及其发达的国家,上个世纪以来,美国国会、政府先后通过了上百个大大小小的法规,分别对数据的收集、发布、使用和管理等关键环节都做出了具体的规定。如1980年美国国会通过的《纸面工作精减法》、美国信息和管制办公室每年都编制的“年度信息收集预算”,都旨在规范、控制联邦政府的信息收集工作,因为联邦政府为了完成信息收集的任务会给全社会带来很大的人力、物力和时间上的负担。美国国会在不断制定新的法规,因此需要不断收集新的信息,并且一些选择性提交的数据有很大的波动性,从而导致全社会填报信息的负担增加。如1995年,联邦政府信息收集负担约为65亿小时,相当于320万人一年不吃不喝才能完成的任务量,2009年这一数字更是上升到了99亿小时。虽然面对如此庞大的天文数字,减负的作用是有限的,但这却是一个经人民选举、授权产生的政府在面对人民时必须具备的姿态。
隐私权是一个关于信息数据的重要话题。美国最早意义上的隐私权集中在以住宅为代表的物理空间之上,但后来随着技术的发展,美国社会对于隐私权的保护也在发生着深刻的变化,其重心不断转移,经历了从住宅到人、再到信息的转变。著名的奥姆斯泰诉美国政府案、凯兹诉美国政府案都引发了美国社会对隐私权的广泛讨论,对美国社会产生了深远影响。近几十年来由于信息社会的兴起,个人身份数据广泛存在于各个公共组织和场所,每个人的活动其实无时无刻不在被记录。1974年美国通过了《隐私法》来抵御行政权力对个人隐私的恶劣入侵,该法规定:行政机关收集保存的公民个人信息,只能用于信息收集时规定的目的;…个人有权知道其信息的使用情况,还可以查询、核对、修改自己被行政机关收集记录的个人信息。这是一部真正的信息时代的隐私法,保护了存储在政府机关内部的“个人信息记录”。
数据开放运动:数据革命改变世界
几十年来,美国的软件业一直在全世界占据领先地位。然而软件一度被理所当然地视为一种专利,是私有的。在早期,几乎所有的软件公司都拒绝公布源代码。但很快就出现了反对软件专有化和商业化的挑战者,一套自由的、开放的操作系统被开发出来,即现在大名鼎鼎的“Linux”。进入21 世纪以后,开源软件已经深入人心,几乎整个软件业都认识到了开
放源代码的重要性及其好处。软件是由代码和数据组成的,当开放代码已经成为共识和现实的时候,新一代的创新者,自然又将眼光投向了数据。
2004 年,美国民间建立了首个公共数据的开放网站: TrackGov.us。这是一个关于国会立法法案的数据开放网站,每月有近百万的点击率。毫无疑问,该网站给学术研究人员带来了极大的方便,也为关心某个法案的公司、个人提供了在线查询跟踪的工具,同时,这些数据更成为了新闻界监督政府的利器。美国总统奥巴马在担任国会参议员的时候就加入了初期乍兴的数据开放运动,他和共和党参议员科伯恩联合推出了《联邦资金责任透明法案》,其基本理念和TrackGov.us是一样的:建立一个完整的、专业的公共支出数据开放网站,以统一的格式提供可以下载的数据,以供公众查询使用。2006年9月,该法案经小布什签署后,成为法律。2007年,根据该法的规定,网站USAspending.gov上线发布,成为美国联邦政府发布公共支出信息的门户网站。这是个巨大的数据开放网站,可以对联邦政府2000年以来达3万亿的政府资金使用情况以及30多万个政府合同商所承包的项目进行跟踪、搜索、排序、分析和对比,其数据每两周更新一次。网站上线之后,受到了社会各界的极大好评,获得了"政府搜索引擎"(Google for Government)的美誉。
从软件的开源运动到政府数据开放网站,数据开放运动印证了数据革命为这个世界带来的巨大转变。而且,随着信息时代的迅速发展和民主政治的需求,我们有理由相信,这种转变还将继续。
(里瑟琦智库研究助理马晓旭编写)
转载本文请联系原作者获取授权,同时请注明本文来自汪洋科学网博客。
链接地址:https://wap.sciencenet.cn/blog-2903646-938294.html?mobile=1
收藏