English  简体中文
   

Facebook如何搞砸的--- 全球5000万+的用户信息泄露事件

2018-06-10      


一项长达数月的调查揭露了剑桥分析公司可能使用不正确的学术数据来制作其心理测量资料。

 

2014年初,在一个奇怪的选举季节前几年,一群虚假的故事,网络攻击和外国虚假宣传活动遭到破坏,成千上万的美国人被要求参加测验。在亚马逊的Mechanical Turk平台上,用户可以通过付费来执行微任务,用户可以被支付1美元或2美元的费用来回答关于他们个性的问题,并将他们的Facebook数据和他们所有朋友的数据交给他们。调查网站Qualtrics也发布了类似的请求。不久之后,一些人注意到这项任务违反了亚马逊自己的规则。

 

“嗯。 。 。登录到Facebook,以便我们可以在2014年5月在留言板上写下'一些人口统计数据,你的喜好,你朋友的名单,你的朋友是否互相认识,以及你的一些私人消息'。“消息,甚至?!我希望亚马逊能够监听我们所有违规标志并禁止请求者。这太荒谬了。“另一位参与测试者嘲笑测验设计者保护用户数据的承诺:”但它完全安全的缺陷[e],相信我们。“

 

收集数据的是剑桥大学心理学讲师Aleksander Kogan,他正在被政治咨询公司Cambridge Analytica雇佣,以便在许多美国重要州收集尽可能多的美国人的尽可能多的Facebook数据。该公司在右翼亿万富翁捐赠者罗伯特默瑟的支持下,后来声称帮助特朗普赢得胜利,其中包括,作为当时的CEO在2016年9月吹嘘的一个心理测量学模型,以预测每个成年人的个性美国“。有了足够好的数据,这个想法是,剑桥分析可以将选民分成很小的部分,微型目标恰好是合适的国家的合适选民,具有情感定制的,低于雷达的在线广告,在一次非常紧张的选举中,从理论上讲,可以从选民的思想中获得优势。

 

后来4年,五千万用户数据收获已经成为多个大陆日益火爆的中心,吓跑用户和投资者,派遣立法者,监管者和记者,并让社交网络的管理人员争先恐后地面对他们最大的问题危机至今。

 

 Carole Cadwalladr和其他记者在卫报,纽约时报和英国的第四频道曝光后的几天内,首席执行官马克扎克伯格在Facebook上解释了该公司如何解决问题并提供自己的事件时间表。他表示,Facebook首先从Guardian的文章中了解到2015年12月的Cambridge Analytica项目,并且后来确信数据已被删除。但该公司没有提供关于它如何追踪12月份盗版数据的细节。它也没有提到Kogan的主要合作者Joseph Chancellor,他是该大学的前博士后研究员,他在同一个月开始在Facebook工作。 Facebook没有回应具体的评论请求,但它表示正在审查大法官的角色。

 

关于剑桥Analytica项目的担忧 - 去年由Das Magazin和The Intercept的记者也详细介绍 - 首先在2014年出现在大学的心理测量中心内。由于数据收获在当年夏天进行,学校转向外部仲裁人努力解决高根和他的同事之间的争端。根据与Fast Company交谈过的文件和熟悉此问题的人士的说法,人们担心Cambridge Analytica有兴趣对大学自己的模型缓存和Facebook数据进行授权。

 

也有人怀疑科根在剑桥分析公司的工作中可能不恰当地使用了学校自己的学术研究和数据库,该数据库本身包含数百万的Facebook个人资料。

 

Kogan否认他曾使用学术数据进行他的副项目,但在他退出该流程后,仲裁结果迅速而不确定,并引用了与剑桥分析公司达成的保密协议。一些问题没有得到答复。据一位熟悉事件的人士透露,该学校考虑采取法律行动,但最终由于担心将研究中心及其学生带入可能漫长而丑陋的争端所涉及的时间和成本问题而被抛弃。

 

当时心理测量中心副主任Michal Kosinski在11月告诉Fast Company,他无法确定该中心的数据未被Kogan和Chancellor不当使用。 “Alex和Joe收集了他们自己的数据,”Kosinski在一封电子邮件中写道。 “他们有可能偷走了我们的数据,但他们也花了数十万[亚马逊Mechanical Turk]和数据提供商 - 足以收集比我们样本中可用的更多的东西。”

 

剑桥大学的一位发言人说在Fast Company的一份声明中,没有证据表明Kogan已经利用该中心的资源开展工作,并且已经寻求并得到了他的保证。但大学官员也联系了Facebook,要求提供“他们掌握的所有相关证据”。他强调,Cambridge Analytica与大学没有任何关系。总理和高根没有回应置评请求。

 

该大学自己的数据库拥有超过600万个匿名Facebook个人资料,可能仍然是用于研究目的的最大的Facebook数据公开缓存。五年来,当时的研究助理Kosinski和David Stillwell使用了Stillwell创建的流行早期Facebook应用程序“我的个性”,在用户同意的情况下管理个性测验并收集Facebook数据。 2013年在美国国家科学院院刊上的一篇论文中,他们使用数据库来展示人们的社交媒体数据如何以惊人的准确度被用来评分和预测人的人格特质。

 

 剑桥大学的心理测量学预测。 Kogan在剑桥经营自己的实验室,致力于促进亲社会和幸福,2014年1月,他首先在伦敦与Cambridge Analytica讨论了心理测量学。随后他向Stillwell提出要求许可学校预测的建议代表剑桥分析公司的附属公司SCL集团的模型。这种安排并不罕见 - 大学定期为商业目的许可他们的研究以获得额外资金 - 但谈判失败了。随后Kogan获得总理职位,两人共同创立了一家公司Global Science Research,以建立自己的Facebook数据和心理模型缓存。

 

对于这个项目,Kogan更新了他自己的数据收集Facebook应用程序的描述,以表明这些个人档案不是用于“学术”,而是“商业”目的,上周他曾提出过。但Facebook表示,他允许收集大量数据的行为严格限于学术使用,并且他通过与第三方分享数据而违反了规则。

 

除了关于科根如何使用大学自己的数据和模型的问题之外,他的同事很快就对剑桥分析和SCL的意图感到担忧,他们的过去和现在的客户包括英国国防部,美国国务院,北约,以及世界各地的一系列政治运动。在心理测量中心,担心Kogan的工作与大学及其数据库的联系可能会损害该部门的声誉。

 

外部仲裁在当年夏天开始,当高根退出程序时正在进行。在心理测量中心的要求下,高根,校长和SCL以书面形式提供证明,证明该大学的知识产权没有被送到公司,事情就此消失。

 

在几个月内,Kogan和Chancellor完成了他们自己的数据收集工作,花费剑桥分析公司的总成本 - 为超过3400万的心理测量分数和5000万Facebook个人资料数据 - 大约800,000美元,或者每个配置文件约0.016美元。到2015年夏季,校长在LinkedIn的页面上夸耀说,全球科学研究现在拥有“在美国各地拥有超过40万人的庞大数据库 - 我们已经为他们每个人创建了详细的特征和特征概况。”

 

2015年12月,随着Facebook开始调查数据收集情况,Chancellor开始在Facebook Research工作。 (根据他的公司网页,他的兴趣包括“幸福,情感,社会影响和积极的性格特征”。)社交网络显然会在接下来的几个月里继续研究被窃取的数据。迟到2017年4月,Facebook发言人告诉Intercept,“迄今为止我们的调查并未发现任何暗示不当行为的事情。”

 

亚马逊最终会在一年后的2015年12月禁止高根和GSR,因为卫报的记者描述了发生的事情。 “我们的服务条款明确禁止滥用,”亚马逊的一位发言人告诉Fast Company。但是,到那时为时已晚。成千上万的美国人以及他们的朋友 - 数百万美国选民甚至从来不知道这些测验 - 都不知不觉地陷入了一种奇怪的新型信息战中,一场不是由俄罗斯人,而是由英国人和美国人发起的。

 

 关于剑桥分析师所做的工作仍有许多疑问。帕森斯设计学院副教授大卫卡罗尔本月在英国提出索赔,希望获得所有关于他的数据 - 不仅仅是他的选民档案中的预测分数,而是它的数据派生出来 - 并解决他一直追求的一连串神秘事件。 “他们从哪里得到这些数据,他们是如何处理这些数据的,他们是与谁分享的,我们是否有权选择出来吗?”

 

 与此同时,正在调查特朗普竞选活动与俄罗斯之间可能联系的特别顾问罗伯特穆勒(Robert Mueller),对于剑桥分析公司的工作以及其数据可能已经消失的问题有自己的疑问。去年,他的团队要求来自剑桥的电子邮件,并获得搜查令来检查Facebook的记录。它还采访了特朗普的女婿Jared Kushner和特朗普竞选人员,并传唤了史蒂夫班农。前特朗普顾问是2014年至2016年中剑桥分析公司的副总裁,当时他加入特朗普竞选担任主席。前特朗普的顾问,迈克尔弗林中将,他曾在穆勒的调查中承认他与俄罗斯官员的谈话谎言,去年8月透露他也是剑桥分公司SCL集团的有偿顾问。

 

 剑桥分析公司上个月在一份声明中重申了其声称,称其于2015年删除了Facebook数据,并于2016年进行了内部审计以确保其数据,并且“在2016年的工作中没有使用任何GSR数据美国总统大选“,Wylie说这是”绝对不真实“。

Kosinksi也对剑桥分析公司的说法持怀疑态度。他在去年11月的一封电子邮件中写道,当被问及公司的矛盾账户时,“CA会说任何事情来减少他们所处的合法热度。” “具体来说,Facebook命令他们删除数据和派生模型;承认他们使用这些模型不仅会让他们陷入麻烦,而且还会让世界各地的调查人员陷入困境,而且还会让Facebook陷入麻烦。“

 

“我不知道为什么有人会听他们说什么,”他补充说。 “因为他们现在必须说谎,或者他们早些时候在撒谎,并且他们有明显的谎言动机。”

 

卡罗尔针对剑桥分析公司的法律诉讼依据的是英国法律,该法律要求公司披露所有关于个人的数据,不管其国籍如何。卡罗尔希望美国人会要求严格的数据法规,看起来更像欧洲,但是对于剑桥分析公司来说,鉴于它似乎在英国存储数据,他认为合法的洪水门已经开放。 “事实上,每个美国选民都有资格起诉这家公司,”他说。

 

对卡罗尔而言,剑桥实际影响选举能力的问题与更重要的问题是分开的:一家总部位于英国的公司正在收集大量有关美国人的数据,以影响他们的选举。 “从最基本的角度来说,这只是一个令人难以置信的入侵隐私,将我们的消费行为重新附加到我们的政治注册上,”Carroll说。 “这基本上是剑桥分析公司声称能够做到的,并且是按规模来做的。我们认为在我们和我们的治疗师或医生之间保持保密的心理状况不是一种心理状况吗?“

 

 然而令人毛骨悚然的是,剑桥分析师面临的更大问题不在于它为特朗普做了什么或没做什么,或者它的技术有多有效。以心理为基础的消息传递,特别是随着消息的改善,可能会在紧张的选举中发挥重要作用,但这些事情很难衡量,许多人称该公司声称热气腾腾。更大的愤慨是剑桥分析公司揭露了它所利用的系统,这是一个建立在我们个人数据之上的庞大经济体系,其经济规模不断增长,而且这种现象已经很普遍。到本周结束时,即使扎克伯格也在大声宣布是的,也许Facebook应该受到监管。
中国密码学会电子认证专业委员会 版权所有
地址:北京市海淀区闵庄路甲89号 4号楼
联系电话:010-82546543-686
京ICP备05046059号-4