王佳雯

大数据时代,谁来保护我们的隐私
2018-04-19 09:26

在数据安全与隐私保护中,不存在毕其功于一役的技术与手段。图片来源:百度图片 

即使有不断加强的研究和新技术手段,在技术层面上也很难根本解决数据泄露、侵犯隐私的问题。

■本报记者 王佳雯

“这是我的错误,我很抱歉!”脸书(Facebook)创始人兼CEO扎克伯格道歉了。美国当地时间4月10日,自3月份脸书卷入用户数据泄露丑闻,甚至被指所泄露的数据影响了美国大选之后,扎克伯格现身美国国会参议院的听证会,在44位参议员5小时的拷问中,面对媒体的长枪短炮不断道歉。

认错,这是扎克伯格此次听证会证词中最重要的关键词。虽然这并不能真正挽回事件已经造成的影响,但从市场反馈来看,扎克伯格独自面对参议员质询的形象,还是赢回了不少信任——脸书股价在当日大涨4.5%,为该公司挽回了200多亿美元市值。

错的不只是“脸书”

公众需要扎克伯格道歉。特别是当公众得知,泄露的用户数据波及范围从5000万人增加到8700万人并有可能影响了重大政治事件后,人们对这家意图联通世界的互联网公司信心扫地。脸书股价短期内最大跌幅达13.52%,公司750亿美元市值随之蒸发。

事件发酵至今,在对脸书一边倒的抨击中,也不时有微弱的声音阐述不同意见。有社交媒体就曝出,一位硅谷互联网公司做广告推荐算法的工程师就认为“脸书没有错”。

回顾数据泄露过程,事件起源于一款风靡美国的人格测试第三方应用。“经过授权后,用户自愿参加问卷调查,第三方就能获得你的信息,事实上,整个过程是用户同意的。”上海交通大学计算机科学与工程系教授朱浩瑾分析称。

这款依托于性格测试的游戏,具备借助社交网络信息分析用户行为模式和倾向的能力,它不仅可以通过从用户在脸书上的点赞信息推测用户教育情况、行为模式、政治倾向,甚至能够推测用户儿童时期是否受过心理创伤。

一家名为全球科学研究(GSR)的公司利用上述游戏的机理,开始收集脸书用户数据,受访者需要开放自己脸书账号以登录该应用,并可以获得约5美金的报酬。

30多万美国民众参与了测试,但由于该应用同样可以收集脸书账号好友的点赞记录和个人信息,最终5000万用户受影响,而脸书经调查发现,实际受影响用户达8700万。这些数据最终被转卖给了被指影响美国大选等政治活动的剑桥分析公司(Cambridge Analytical)。

“这次数据泄露事件就是由于GSR对数据进行了非法售卖而导致的。根据脸书的数据使用政策,第三方应用所收集到的用户好友数据,只能被应用于提升用户体验,不允许被用于进行售卖或广告投放。”浙江大学网络空间安全研究中心主任任奎告诉《中国科学报》记者。

在上述用户数据收集并最终泄露的过程中,脸书 “没有对第三方程序给用户带来的风险及时监督、监管”,但同样应当受到谴责的还有导致用户数据被用于不道德目的的GSR公司。

数据“更懂你”

无独有偶,脸书公司所遭遇的信任危机,国内的互联网公司同样也在经历。从对携程利用大数据杀熟的诟病,到今日头条虚假广告风波,拥有用户数据的互联网公司因技术壁垒,在对数据的利用和保护中,相较于普通公众都拥有绝对优势。

脸书事件发生后,中科院心理所心理与行为科学大数据研究中心赵楠与朱廷劭也曾在中科院心理所公众平台对事件做出解读并直指,“我们在社交网络上的一举一动,都是我们性格特点与内心状态的某种反映。”

依据其研究,只要用户的社交网络日常使用积累到一定数量,科学家就可以运用人工智能技术,利用社交网络信息算出用户的性格特点。

尼尔·波兹曼曾在《娱乐至死》一书中指出,“毁掉我们的不是我们所憎恨的东西,而恰恰是我们所热爱的东西。”可以说大数据时代所暴露出来的一系列问题,不仅印证了波兹曼的话,也令他的担忧具有了更广泛的意义。

“现在人工智能、计算机都在为用户提供便利,但这一定要牺牲一部分隐私的,把隐私过渡给计算机,让它知道你的信息,它才能根据信息提供服务。”朱浩瑾说。

事实上,引发脸书此次问题的用户画像技术,在国内互联网公司同样也得到广泛应用。“很多公司都在用隐私数据做定向推广,这和将用户数据转卖给第三方或者用于不道德目的是两回事。”朱浩瑾说。

朱浩瑾解释称,企业要把利益最大化,在对用户画像基础上做广告投放、产品推广,站在算法的角度上无可厚非。只不过,即使是出于合理商业目的,正确利用算法不断精确用户画像,隐患也已初露征兆。专家担忧,过度追求精确的用户画像,正不断增加在用户的隐私在无形中受到侵害的风险。

“隐私的终结”待何时?

2015年,《科学》杂志曾发表专刊探讨“隐私的终结”。 至今3年过去,追求互联互通的互联网技术,越来越多地开始经受是否侵犯隐私、如何合理利用用户数据的拷问。学界与企业的讨论、公众的质疑与担忧,未能推动衍生出可以保护用户隐私的根本性举措。

“隐私是个很复杂的事情,不同的场合、不同的人,对于隐私的认识都不太一样。”朱浩瑾说。尽管如此,以国内为例,2017年正式实施的《网络安全法》事实上已经推动了一部分个人属性信息的保护,比如“位置信息”。只是,目前来看,这样的法律约束犹显不足。

现在用户的数据一旦有了“一度公开,二度公开就很难避免”,任奎解释说,所谓二度人脉是指好友的好友、同学的好友等间接人脉关系,目前这样的人脉关系已经成为脸书等平台帮助用户扩大人际关系网的热门手段。

但在脸书的数据泄露案例中,正是这样的二度公开信息,让没有同意参与数据搜集的用户信息也无辜被泄露、利用。这无疑会带来巨大的隐私隐患。

同时学者们也关注到,互联网公司收集到的用户数据存在“从一个企业内部走向另一个企业”的情况。于是才会出现,当用户在一个互联网平台搜索某些信息,在另一个平台便会出现他所搜索信息的相关产品推广。

“这样的大数据应用是有价值的。”朱浩瑾说,但随着企业的用户画像越来越精确,企业间的数据交流是否会涉及到用户隐私问题也备受学界关注。专家提醒,在数据安全与隐私保护中,不存在毕其功于一役的技术与手段,但可以肯定的是,政府的监督、企业的自律、科研人员的探索、公众的自我保护每个环节都必不可少。

从技术层面,国外的研究人员研究了差分隐私技术,可以既保护个体隐私,又允许相关企业、机构从整体上做数据分析。目前,苹果、谷歌等公司已经开始使用,而国内互联网企业也对相关技术十分关注。

“这不是某一家互联网公司存在的问题,要解决这个问题需要多方面的努力。一方面用户保护隐私的意识不断提高;另一方面,对于每种服务相关信息的具体使用也需要更好的监管。”任奎最后强调。

专家坦言,即使有不断加强的研究和新技术手段,从技术层面上很难从根本上解决数据泄露、侵犯隐私的问题。面对不断发酵的用户数据滥用问题,更重要的是,通过行之有效的监管手段,为互联网企业在追逐经济效益的诉求时套上法律与监管的缰绳,在寻求经济效益与社会效益间、在为公众提供便利与保护公众隐私间找到微妙的平衡。

《中国科学报》 (2018-04-19 第5版 技术经济周刊)

分享到:

0
一周排行