注册
河南 > 科技

大数据之于政治,水与舟?


来源:信息时报

美国社交媒体平台脸书公司5000万用户数据被指由英国剑桥分析公司用于大数据建模,以便影响公众政治选择,分别涉及美国总统选举和英国脱离欧洲联盟公投。大数据分析曾被寄予厚望,但这类丑闻让人们发现,大数据可能被恶意利用,甚至反过来操控数据的提供者本身。但以时代发展的角度来说,将大数据运用到竞选等政治活动是大势所趋,但同时数据安全如何保障,又成为一个不得不思考的问题。

原标题:大数据之于政治,水与舟?

脸书“泄密门”丑闻不断发酵,分别涉及美国总统选举和英国“脱欧”公投。对此,扎克伯格登报道歉。

美国社交媒体平台脸书公司5000万用户数据被指由英国剑桥分析公司用于大数据建模,以便影响公众政治选择,分别涉及美国总统选举和英国脱离欧洲联盟公投。大数据分析曾被寄予厚望,但这类丑闻让人们发现,大数据可能被恶意利用,甚至反过来操控数据的提供者本身。但以时代发展的角度来说,将大数据运用到竞选等政治活动是大势所趋,但同时数据安全如何保障,又成为一个不得不思考的问题。

剑桥分析公司是何来历?

此次脸书“泄露门”事件,让剑桥分析公司走入大家的视线。

这家公司成立于2013年,其1500万美元启动资金来自亿万富翁、美国共和党的大金主罗伯特·默瑟。据官网介绍,剑桥分析公司在24个不同国家和地区拥有分部。

剑桥分析公司这几年一直活跃在大小选举和公投活动中,公司宣传自己的“数据驱动”竞选宣传策略能帮助客户赢得选举。该公司官网的宣传页就放上了特朗普竞选总统时的画面,网页上还写着:“我们是数据驱动竞选宣传方面的全球领先者,在这方面拥有超过25年的经验,在5大洲服务了超过100个竞选活动。”

影响美国大选建立模型、精准投放广告

最先曝光的脸书丑闻牵涉美国2016年总统选举。多家媒体报道,脸书5000万用户信息遭剑桥分析公司获取,用于建立模型,以精准投放广告等方式,影响美国总统选举结果。

扎克伯格登报致歉

3月17日,包括英国《卫报》、美国《纽约时报》在内的多家媒体报道了一场规模极大的数据泄露事件:超过5000万脸书用户的信息数据被一家名为剑桥分析的公司泄露,并用于影响2016年的美国大选。

这个数字接近脸书美国活跃用户的三分之一,美国选民总人数的四分之一。脸书声称以用户为核心,保护隐私意味着收获信任,是整座“大厦”的根基。消息披露当天,脸书的股价暴跌7%。

人们在网络上发起一项名为“删除脸书(#DeleteFacebook)”的运动,美国联邦贸易委员会针对脸书启动调查,多名政府议员要求脸书CEO马克·扎克伯格亲自出席相关听证会。

一直到5天后,扎克伯格才出面道歉。接受CNN(美国有线电视新闻网)专访时,他眼眶通红,黑眼圈明显,认真地解释事件细节,承诺会尽全力避免类似情况再次发生,一改往日在公共场合阳光乐观的形象。

“我们有责任保护你们的信息。如果做不到这一点,就不配得到(你们的信任)。”他在9家著名报纸刊登整版致歉,并在脸书的个人页面上发文道歉。

但道歉拯救不了脸书的股价。在过去的一周里,这家公司的市值蒸发了750亿美元,连带同类公司的股价也一起下跌,其中包括苹果、推特。

脸书数据遭窃用过程

说回来,这一次脸书用户的数据是如何被“窃用”的呢?

媒体报道称,英国剑桥大学心理学教授亚历山大·科肯2014年推出应用软件“这是你的数字化生活”,以个性分析测试的名义投放脸书平台。对这些个人信息,科肯给出的价码是5美元。用户完成上述操作,就能得到5美元奖励。

27万美国人参加了测试,他们大多没有阅读用户协议就点击了“同意”,把自己和好友总计5000万人的数据交给了科肯,它们随后成了剑桥分析服务器里庞杂的数据表格。

后来,科肯将这些用户数据出售给了剑桥分析公司。4年前,在得知科肯违规出售用户数据后,脸书曾要求科肯和剑桥分析删掉数据、出具书面保证。脸书还在几个月后更新了隐私条款,即使用户允许,第三方机构的权限也极受限制。没有人想到,当时的一个疏忽,会在几年后演变成这家公司历史上最大的信任危机。

特朗普竞选团队否认

这不是黑市里常见的“账户密码”信息,或是联系方式、住址等隐私,而是包含每个人性格特征的索引。虽然未曾谋面,但这个人偏理性还是情绪化,有主见还是从众,是否完美主义……信息分析者都知道。在剑桥分析的服务器里,他们是一个个被精准勾勒出形象的个体。

用户不会收到推销商品的广告,但会被推送有针对性的信息。这种影响无法被量化,是潜移默化、难以察觉的。至少包括特朗普在内的一系列政客相信它确实能够影响美国大选——特朗普的前助手是剑桥分析的副总裁,竞选团队也投资了该公司。

但特朗普竞选团队否认使用过剑桥分析公司数据,声称竞选所用选民数据都来自共和党全国委员会,仅雇用剑桥分析公司做电视广告,与一些数据员有过合作。

剑桥分析公司首席执行官亚历山大·尼克斯在丑闻曝光后已被停职。

3月26日,一位为英国脱欧组织“投给脱欧”工作过的爆料人沙尼(左)和“剑桥分析”前员工威利(右)出席活动。

据称,剑桥分析公司为英国“脱欧”阵营做了大量工作,对外却矢口否认。

影响英国“脱欧” 自由公正的投票“存疑”

除了牵涉美国2016年总统选举,剑桥分析公司前政治分析师布里塔妮·凯泽指认,剑桥分析公司为英国“脱欧”阵营做了大量工作,对外却矢口否认。

违规使用资金并瞒报

英国商人、“脱欧”阵营“大金主”阿伦班克斯澄清称,“脱欧”阵营从未从剑桥分析公司收取过数据分析资料。剑桥分析公司确实想卖,但他没有买。不过,班克斯的赞助对象之一、英国独立党承认,给剑桥分析公司提供过数据用于分析。英国独立党同样致力于“脱欧”。

3月25日,剑桥分析公司前工作人员克里斯托弗·威利曝光最新证据,指认“脱欧”阵营在公投前的宣传活动中违规使用资金并瞒报。

为规避单一机构宣传资金不得超过700万英镑的规定,“脱欧”政治团体“投票脱欧”申报的“脱欧”宣传资金为677万英镑(6031万元人民币),但不包括它赠予另一政治团体“相信脱欧”的62.5万英镑(557万元人民币)。

这笔钱被“相信脱欧”花在了聘请数字化营销公司上,它雇用的公司和“投票脱欧”一样,都是Aggregate IQ公司。值得一提的是,Aggregate IQ在美国的业务包括为英国剑桥分析公司开发软件。

涉及两个“脱欧”团体

代理律师事务所宾德曼斯事务所公开的证据大约50页,已递交英国选举委员会。这些证据显示,“投票脱欧”除了资助“相信脱欧”,还协助“相信脱欧”打响知名度。两个团体不仅有相同办公地点、使用同样硬盘保存“脱欧”资料,还频频就“脱欧”事宜沟通。

“投票脱欧”的代表成员包括英国外交大臣鲍里斯·约翰逊。“相信脱欧”则主要针对学生群体。多名法律界人士认为,单从书面证据看,已经“证据确凿”。

威利说,Aggregate IQ公司雇员曾告诉他,“投票脱欧”与“相信脱欧”关系非法,因为按照规定,政治团体不得暗中联手协作。威利说,公投背后有违规操作,令人质疑公投结果。“如果英国做出的是不可逆转的决定,我们需要相信这一决定经过了自由公正的投票,而这些证据使这种自由公正存疑。”

英国信息监管局介入调查

就脸书用户数据泄露,英国信息监管局向法庭申请了搜查令,获准后派遣调查人员进入剑桥分析公司位于伦敦的办公地点。英国媒体报道,大约20名调查人员得到大厦安保人员放行,进入剑桥分析公司办公室,查阅数据和文本资料。

英国信息监管局一名发言人说:“此次调查只是一小部分,整个调查将涉及个人数据被分析利用于政治目的。我们现在需要搜集资料、评估和审视证据,才能得出最后结论。”

不过,就媒体曝光的脸书丑闻,脸书、剑桥分析公司和科根都拒绝“背锅”。英国剑桥分析公司代理首席执行官亚历山大·泰勒3月23日致歉公众,但坚称剑桥分析公司一直以为,公司获取的原始数符合脸书的用户服务条款以及数据保护相关法律法规。而剑桥分析公司首席执行官亚历山大·尼克斯在丑闻曝光后已被停职。

总统选举方式已改变

奥巴马借大数据成功连任

在2016年的美国大选中,新技术不断被开发并使用,过去的传统技术被应用到极致。美国总统竞选从来都是一项注重公众参与的活动,了解公众的需求,了解公众的喜好和愿望再加以满足,是入主白宫的根本;现在的候选人们早已意识到,大数据技术是走进白宫必要的门票。

不过,其实美国总统想利用大数据来帮助竞选早就不是什么新鲜事,社交网站的数据泄露问题也由来已久。《洛杉矶时报》克里斯蒂·帕森斯和凯瑟琳·亨尼西就曾说:“没有任何总统竞选活动像奥巴马那样如此仰仗于科学分析方法,奥巴马的竞选团队充分运用信息来预测投票态势。或许美国总统选举的方式已经彻底改变了。”

依靠大数据预测投票态势

在《大数据预测》一书中,作者详细分析了当年奥巴马是如何依靠大数据技术来预测投票态势的。或许你知道,奥巴马在2012年美国总统选举中投入重金,聘请了超过50多名分析学专家。

或许你也知道各种令人眼花缭乱的总统竞选活动,这些旨在夺取全世界最有权势职位的活动,虽然一直要吵吵嚷嚷到投票前的规定静默期,但实际上最终只是为了影响一小部分选民,即那些在政治立场不坚定的州里的摇摆选民。

美国总统利用大数据来帮助竞选早就不是什么新鲜事,奥巴马2012年就利用说服模型会开启政治竞选中的全新篇章。

但大部分人所不知道的是,总统竞选活动要把针对范围进一步缩小,美国总统竞选确实是把微观定位提到了全新的高度。奥巴马的竞选团队押对了宝,他们通过上提模型设计了数百万份针对个体选民的竞选决策,由此也打破了竞选周期的常规,收到了十分积极的说服效果。

但2012年的风潮还不止于此。现在,人们的关注点已经超越了竞选活动定位,而是开始关注竞选背后的数理分析。

普通预测是等到美国各州结果出来之后进行总结判断,但预测分析却可提供旨在指导行动的知识:对每个选民进行预测。

说服建模的成功运用

总统选举的标准一定要超过那些普通的商业营销。在这种精益求精的无情竞争中,可支配的资源显得尤为宝贵。

“我们的建模团队对每个政治意向不明确的州都建立了说服模型,”2012年美国总统选举中奥巴马阵营的首席数据科学家拉伊德·加尼表示,“然后再用模型去预测,在这些州里,数百万摇摆选民中每个选民的具体情况如何。模型会告诉我们,我们能为奥巴马赢得哪些选民,以及我们应该避免接触哪些选民。”

对模型所预测的每个可说服的选民,竞选团队都配备了大量的资源,志愿者会站在街上宣传鼓劲,也会拨打电话到家里,劝说他们为奥巴马投票。当志愿者开始家访时,他们并不是挨家挨户敲门,而是针对那些被预测系统定位为可影响的选民敲门。类似地,传单也主要用来针对那些可说服的选民。

说服建模取得了效果。相比其他传统竞选定位方法,这种方式让更多的选民选择了奥巴马。而且,说服模型也引导了奥巴马竞选团队的广告投放。电视节目的广告时段会按收视人群的多寡和分布来售卖广告位。奥巴马竞选团队会用说服模型来梳理这些收视人群数据,然后确定在哪里投放广告。

这是先进技术,也是分析学的前沿应用,但这并不神秘,说服模型会开启政治竞选中的全新篇章,即便脸书被曝光了,特朗普寻求连任的路上,也离不开大数据的应用。

贩卖个人信息

地下数据黑产业链十分活跃

多年来,以贩卖个人信息为主的地下数据黑产业链十分活跃,这在一定程度上制约了合法大数据交易产业的发展。

据了解,正规交易的数据需要经过采集、清洗、脱敏、脱密、融合等流程,保障了数据的合法性、真实性和安全性,成本也相应提高。但黑市交易的大部分数据多由内鬼或黑客窃取得来,几乎是无本万利。比如,正规渠道的人脸识别数据价格为每条0.1元,而黑市上只需花1分钱就能获取同样的数据。

几年前,全球最大的电子邮件营销公司艾司隆(Epsilon)发生了史上最严重的黑客入侵事件,主要的企业客户名单以及电子邮件地址因此外泄,受害企业包括摩根大通、第一资本集团、万豪酒店、美国银行、花旗银行及电视购物网络等。而就在不到一个月时间的同年4月底,索尼公司遭到黑客攻击,泄露了一亿份账户资料,其Play Station网络和Qriocity流媒体服务不得不关闭将近一个月。索尼公司因此花费了约1.71亿美元来弥补这个损失。

业内专家表示,随着云计算、物联网和移动互联网等新一代信息技术的飞速发展,大数据应用规模日趋扩大,在数据采集、存储、开放共享等方面均存在安全隐患。由于数据隐私管理法规不健全,数据产权立法滞后,缺乏推动各个部门数据交换和共享的制度、规范和标准,公民隐私得不到合法保护,与此同时,社交网站的隐私数据也可能被不法商家利用,这些都给数据安全带来了巨大的挑战。

关于隐私保护

欧盟推《通用数据保护条例》

如今,在互联网时代各类媒体掌握着大量用户数据,数据采集分析技术也日新月异。在日常生活中,搜索诸如疾病或者地点类词条后,网站就跳出相关产品和服务广告已不是新鲜事;打开打车或者运动手机软件,生活轨迹一目了然;在社交媒体上订阅新闻推送,为某个群体和活动点赞,可能已经暴露了你的兴趣爱好乃至价值取向……

而大部分人对自己什么时候被采集了哪些信息、信息会被如何利用、能否选择性删除数据、软件公司通过何种方式保障隐私安全等问题,都一头雾水。

需要法律规范

没有健全的法律规范,仅靠企业自律来保护用户个人隐私,可能引发民众对大数据技术的恐惧。对此,欧洲正以立法等形式清理个人“数字足迹”、保障信息安全,让网络使用者拥有“被遗忘权”。

英国政府在2017年8月宣布将修改相关法律条文,让个人对自己的数据拥有更大掌控权,比如可要求脸书等社交媒体平台删除一些自己以前发布的个人信息,且机构收集个人数据的过程也会被更严格地监管。

拥有“被遗忘权”

被看作数据保护里程碑式法律的欧盟《通用数据保护条例》也将于今年5月25日正式生效。此外,欧盟还在致力于建立一套适用于全欧盟范围的、有关网络安全“产品、服务和程序”的统一安全认证体系。

《通用数据保护条例》第17条“被遗忘权”特别指出,当个人数据与收集处理的目的无关、数据主体不希望其数据被处理或数据控制者已没有正当理由保存该数据时,数据主体可随时要求收集其数据的企业或个人删除其个人数据。

如何更好地保障数据隐私,各国仍在摸索中。不少人认为,此次脸书数据泄露事件可能会促使美国通过立法手段,加强对网络社交媒体和数据安全的监管。一些专家提出,要切实保护用户数据隐私,严格的立法与执法必不可少。例如,欧盟《通用数据保护条例》中,违规企业面临高达全球营业额2%至4%的罚款,强有力的处罚可直接促使企业加强自我规范。

[责任编辑:马敏]

  • 好文
  • 钦佩
  • 喜欢
  • 泪奔
  • 可爱
  • 思考

今日看点

凤凰新闻 天天有料
分享到: