当网络数据成为“数字黄金”,个人隐私不再存在了吗?

如果有人像我想了解格罗弗·克利夫兰的女友凯特·纳什那样想了解一个人在现代的生活,他们会有一个信息宝库,其信息量远远超过凯特不经意间留下的零星的人口普查报告、出生和死亡记录以及偶尔的剪报。他们只需要简单地敲几下键盘,就能获取大量的信息。

然而,并非所有的调查都是善意的。

在2020年夏天,新泽西州一名联邦法官埃丝特·萨拉斯目睹了她的孩子死于一名种族主义、厌恶女性的律师之手。这位律师对萨拉斯法官法庭上的案件拖延感到莫名其妙的愤怒。对于这位律师来说,想要获取萨拉斯一家的住址、常去的教堂以及更多信息是非常容易的。于是他带着一把枪来到了萨拉斯家并对其子痛下杀手。

萨拉斯法官在她儿子遇害后情绪激动地请求保护隐私时说:“有一些公司会出售你的个人详细资料”,并利用这些信息来达到邪恶的目的。她表示,枪手手中有一份关于她的“完整档案”,其中部分内容还是通过互联网上的自由信息流汇编而成。她甚至要求对她的家庭住址进行保密。

如果你曾经经历过官方意义上的档案编制,你会明白“档案”这个词听起来非常恰当。如果不该进入正确数据库的人涉入了,他们就可以购买到关于任何人的数据驱动档案。这就是为什么据说一家英国小报得知女演员梅根·马克尔(哈里王子的妻子)及其家人的“家庭住址、手机号码、社会保险号码等”,因为一名美国私人调查员编制了这些数据,并将其卖给一名编辑,后者随后联系了一些亲戚,并报道了马克尔家庭内部矛盾的情况。

为了了解在这两种情况下可能被披露的信息类型,让我分享一下我自己的档案资料,也就是我的背景调查结果。尽管我的生活相对平静,没有犯罪记录、破产、取消抵押品赎回权或驱逐的情况,如果有人真的想了解我的情况,他们不会发现什么引人注目的东西。我雇用了一名私人侦探,看看他能找到什么,调查结果给了我一份200多页的数据。

这些资料包括一些基本信息,大部分是公众所知道的,比如我的现住地址。传统上,这类信息并不受到保护,因为它是公共信息,一般来说很多人都知道。

但随后我档案的内容却拐到了令人不安的方向。它包括了我从小到大住过的几乎每个地址,许多房子都有购买价格和面积,有些还附有内部照片和平面图。对于我们现在拥有的房产,有抵押贷款的信息;对于我们已经出售的房产,有当前业主的姓名,有时还有他们的抵押贷款利率和出售时的欠款。

资料中还包括我的出生日期、社会保险号码以及十年前的选民登记记录。还有我一生中所用过的电话号码的记录。驾驶记录和驾驶执照照片也在其中。还有一张从网上搜集的我的照片。这里还有我们现在的车辆(包括车牌号码)以及我们十多年前报废的车辆,还有它们的新车主、新地址以及最近的车牌号码。

我的姓氏经常被拼错,所以有一个列出我别名的列表。还有一个列出我亲戚的名单,包括我的直系亲属和他们的出生日期(按月和年),还包括侄女、侄子和其他亲戚(比如,我嫂子的弟弟,虽然我可能只在婚礼上见过他一次),以及他们社会保险号码的前五位数字、目前的电子邮件地址、目前和过去的电话号码,以及目前和过去的地址。对于我“可能的”“很有可能的”同事名单上的人也是如此,其中许多人都是邻居,否则我可能根本不认识他们。

对于他们来说,最麻烦的是—尤其是那些相对友好的家庭成员和邻居——报告还包括他们自己的破产、留置权、判决和犯罪历史等信息。甚至我的所谓“可能的”同事也会被这样揭露出来。

我还有关于其他名叫艾米·盖达的人的关键信息(根据我的报告,在美国有三个人使用这个名字),以及他们的直系亲属。这包括一个人的最后已知互联网协议地址,这是与她的个人电脑或家庭相关的一系列数字,即使她使用假名,也可以用来追踪她的在线活动。

最后,我还有社交媒体报告,尽管我从一开始就避免使用社交媒体,考虑到隐私利益的重要性,但这似乎无济于事。调查我的存在于脸书和其他平台的公司向那些对了解目标人物的帖子感兴趣的人承诺:“通过一次搜索,您可以发现关于对象的更多数字身份信息,这些信息在其他形式的公共记录数据中很难获取,我这边可以帮助您更有效地收集信息和评估风险。”

所有这些并不需要太多费用。最近我进行了一次背景调查,包括以上所有内容,价格为150美元。与我和美国大多数人类似的数据,包括出生日期、亲属、当前和过去的地址、据称的年薪和净资产、据称的就业情况、据称的种族和宗教信仰,都可以在互联网上找到,只需要调查者承诺“不会利用这些信息跟踪任何人”,“不会公开他们的信息或传播流言”。其中一些信息可能是错误的,但其中许多是正确的。

更令人不安的是,一些调查公司承诺,如果价格合适,他们可以获取更多的数据。据说医疗记录的价格为450美元;处方信息为400美元;学校成绩单为450美元。信用卡活动费用为每月150美元;银行账户活动也是如此。最昂贵的搜索费用为600美元及以上,其中包括国际银行记录、保险信息和带有工资的就业历史。据说,从登机口密码到酒店账单再到普通旅客账户数据,几乎所有信息都可以通过支付费用获得。

如果这让人感到不安,请考虑一个更现代的转变:亚马逊知道我有一只斗牛犬,尽管我从未告诉过亚马逊我有一只斗牛犬,但是不知怎么的亚马逊就是知道关于我的这一情况。如果亚马逊知道这些,想象一下还有什么其他信息与我们中的任何一个联系在一起,在某种程度上。阅读亚马逊多年来收集的关于我的数据后,我开始意识到亚马逊对我们的个人信息有多感兴趣。(这得归功于《加州消费者隐私法》,这是一项2020年的法律,赋予加州消费者要求企业收集他们的“个人信息的类别和具体内容”的权利。考虑到这种法律被认为将成为全球趋势,一些公司会向任何提出请求的人提供这些数据。此外,对于许多公司来说,这些数据请求是家常便饭;自2018年起,根据《通用数据保护条例》,欧洲人已拥有这一权利。)

当人们向亚马逊请求他们的数据时,该公司发送了大约80个文件夹,每个文件夹都有自己的子文件夹,其中许多都有着专业的标题,比如“Retail.CustomerAttributes.zip”“Digital.PrimeVideo.Viewinghistory.zip”和“PaymentOptions.1.AmazonPayBrowserBehaviorData.zip”。在这些文件夹中,就像我的数据文件中的俄罗斯套娃一样,出现了“HomeServices.HomeInnovationTechnology.Pets.1.zip”。在该文件夹中有一个被标记为“宠物”的子文件夹,其中包含一个同样被标记为“宠物”的Excel电子表格。在该文件中,有四个词:“斗牛犬”“你的宠物”“狗”“活跃”。上述这些内容都是真实的。

亚马逊如何得知这些信息仍然是一个谜。我联系了该公司,但从未成功与任何知情人士取得联系。也许亚马逊是从我的互联网浏览器的Cookie中得知我有一只狗(回想起来,我想我可能在某个时候在一个宠物网站上购买药物或注册她的微芯片时提供了有关她品种的信息;我朋友是一位网站隐私官员,她通过网络跟踪器获得了免费婴儿配方奶粉样品的到期日期,尽管她从未告诉该公司她怀孕了),或者也许我的斗牛犬信息来自一家数据收集公司,他们以某种方式了解到这些信息。

其中一家数据收集公司就是益百利,它自称为“全球领先的消费者和企业信用报告及营销服务提供商”。益百利维护着超过两亿美国人以及全球更多人的档案,并根据《加州消费者隐私法》向要求其提供个人数据副本的人提供这些数据。在我收到的数据文件中,只是在我确认了该公司已经知道的事实后才发送的:我们目前的银行信息、我近30年前的雇主名称以及我们曾经拥有一辆小货车的事实,这一切都令人耐人寻味。益百利认为我是一个“极有可能”是“奢侈品女装购物者”,“有点可能”是“中低档家具购物者”,以及“不太可能”是“纪念日购物者”,所有这些信息似乎都是从它所谓的我的“地理位置数据”中获得的,也许与最近的那位牧师的数据类似。我在近40个购物偏好和假期相关类别中的大多数都相当准确,对某些商店来说肯定是准确的,对大型商场则是否定的,对暑假旅行肯定的,但益百利还将我与“管理人”和“某个学府”联系在一起,有点可能参观主题公园,这些都是不准确的,但我想这可能是另一个与艾米·盖达有关的事情。

益百利收集了关于我们的信息,根据它所称的“来源”,包括“汽车公司、企业对企业公司、消费者包装品公司、消费者调查公司、消费者、授权数据编译者、电子公司、父母产品公司”以及其他13家公司。它表示,它与“第三方”共享所收集到的信息,例如“公共机构、健康产品公司、媒体和出版公司”,以及其他17家公司,包括“监管机构或执法部门”和“保险公司”。

而益百利很可能比它所披露的更了解我。益百利在我的数据报告中解释说:“我们还保留着被认为是个人信息的消费者数据,”但这些数据受到其他联邦和州法律的保护,其中包括《公平信用报告法》(Fair Credit Reporting Act)、《驾驶员隐私保护法》(Driver's Privacy Protection Act),以及保护医疗记录的《医疗保健信息可携带性和责任法案》(Health and Insurance Portability and Accountability Act)。益百利还隐藏了(甚至对我来说)它所谓的“敏感信息”,其中包括令人耐人寻味的是我的家庭地址。

想象一下,如果某些实体可以获取更多数据,比如来自可穿戴健身追踪器、汽车黑匣子、超市会员卡、新闻消费(一些新闻网站确实跟踪和分享)以及DNA检测结果等方面的信息,他们可以在个人数据报告中添加这些信息。这将构建一个非常全面的个人画像,没有任何一项要素会被遗漏。

这不仅是广告商、雇主和保险公司所希望获得的数据,也是潜在敲诈者甚至似杀手所需的数据。而且,至少在传统上,我们与他人分享的关于自己的信息越多,无论是线上还是线下,我们对信息隐私的要求就越低。

这也难怪萨拉斯法官对数据隐私的追求引起了如此多人的关注。目前有93%的美国人表示他们愿意选择优先考虑会对数据做隐私化处理的公司,65%的人希望能够准确管控公司收集各种数据的能力(另外35%的人可能对这个问题还有误解)。民调公司解释说,对数据隐私的关注是一种“非常强烈且根深蒂固的感觉”,任何认为这种关注会消失的人都在做出否定的判断。

但数据隐私并不仅仅是现代人的关注,法官和其他关键人物早已认识到在信息数据汇编中侵犯隐私的危险。在20世纪50年代,在第一台真正的计算机问世大约十年后,美国最高法院曾对“为了收集数据而无情地暴露个人生活”而表示担忧,并暗示这种行为会使“宪法自由处于危机之中”。20世纪60年代初,计算机科学家开始意识到他们“获得大量新信息存储”的能力可能会呈现出“几乎令个人尴尬的隐私画面”。作为回应,一些书籍出现了,例如《入侵隐私者》(甚至在你阅读此文的时候,你生活中最私密的细节也正在被记录、购买和出售)和《春光乍泄的社会》(这本书描述了大政府、大企业和大教育如何使用窥探设备侵犯你的隐私)。到了1966年,国会开始举行听证会,调查“计算机和隐私侵犯”之间的关系。

那是在20世纪70年代,在哈佛大学法律教授阿瑟·米勒(Arthur Miller)的著作《对隐私的攻击:计算机、数据存储和档案》(Assault on Privacy : Computers, Data Banks, and Dossiers)出版之后,以及在《新闻周刊》发表了一篇以一台隐约可见的计算机作为封面的文章“隐私不存在了吗?”之后,最高法院提出了保护公立学校编制的有关特定学生数据的建议。一些法官特别担心技术已经产生了数据库,其中关键信息将被存储,使一个人永远成为犯罪嫌疑人。随后的一年,国会采纳了沃伦和布兰代斯在《隐私权》中的思想以及他们对“个人和家庭生活的神圣领域”保护的理念,并通过了《隐私法》,该法主要是基于对“计算机数据库对个体隐私影响”的关注,限制政府收集和发布个人信息的能力。此后,最高法院作出了裁决,承认“计算机数据库中积累的大量个人信息对隐私构成威胁”。在20世纪80年代,大法官们还保护了逮捕记录的整合,指出“计算机化数据库对个人隐私的影响”。

正是在那个时候,《新媒体》杂志预测,由个人与计算机互动所创建的数据库将很快被证明为“数字黄金”,对于那些可能想要获取特定用户或一般信息的公司来说,这将是一个数据驱动的宝库。《麦客世界》杂志警示说,从事这种数据收集的计算机很可能使个人隐私成为过去。这意味着当国会在20世纪90年代中期开始考虑如何通过第230条限制网站和互联网服务提供商的责任时,已有68%的美国人对与计算机和他们的数据收集有关的隐私入侵表示越来越多的关注。这也意味着当一位太阳微系统公司的高管在1999年告诉他们:“你们已经没有隐私了—接受它吧”时,他们并没有。

如今,在数据隐私方面,对此关注的美国人已经增长到98%。人肉搜索已经成为一个常见词汇,它是“Dropping Documents”(放下文件)的缩写,指的是在互联网上公开披露个人的身份信息(例如,家庭地址),以对“被曝光”的人进行报复和骚扰。国会的听证会议题也转向了脸书、社交媒体隐私以及数据的使用和滥用。此外,美国法律协会推出了一个名为“数据隐私的法律原则”的新法律改革项目。

对数据的担忧已经渗透到现代法院的裁决中,尤其是在最近几年,大数据引发了涉及隐私问题和对隐私有重大影响的案例。一家法院审理了剑桥分析公司在2016年总统选举前利用脸书数据投放政治广告引发的隐私案件,指出个人照片和视频、所观看的视频、宗教信仰、政治观点和社交关系信息,即使在社交媒体上与朋友的分享,也应被视为私人信息。法院表示:“当您与有限的受众分享敏感信息时(尤其是明确声明您的受众是有限的情况下),您保留了隐私权,可以起诉某人侵犯这些权利。”另一家法院指出,社交媒体公司可能会受到限制,不能仅仅为了识别目的而扫描照片中的人脸,因为这种使用可能侵犯隐私权。该法院强调,普通法和“对隐私的字面理解”都包括对个人“信息的控制”,甚至包括个人的面部外貌。出生日期已受到某些法院的保护,手机号码、社会保险号码以及互联网浏览记录也都受到法律的保护。

最近,一家联邦法院决定允许一项诉讼继续进行,原因是出版商被告将原告的“个人阅读信息”(包括他的期刊订阅信息)发布给“数据挖掘公司”,后者随后将其与包括姓名、年龄、性别、收入、雇主和“家庭住址”在内的“私密且高度详细的人口统计和个人信息”进行汇总。同样,在2021年,一位联邦法官也允许继续进行一起涉及“从摇篮到坟墓的详细档案”以及个人助理中的语音激活和语音拦截数据隐私权的诉讼。早在2004年,一家联邦上诉法院就认定在编辑过的堕胎记录中的个人隐私应受到保护。法院指出:即使无法从编辑过的医疗报告中了解病人的身份,一旦公开将构成隐私侵犯。

其中一些法院的裁决基于生物识别隐私的利益,例如视网膜或虹膜扫描、指纹、声纹、手或脸部几何形状扫描等生物特征的隐私。这些内容在《2008年伊利诺伊州生物识别信息隐私法案》中得到明确列出,这是第一个保护此类信息的法规。当时的立法者担心,社会保险号码等受损数据可以更改,但生物识别技术对个人在生物学上是唯一的,因此一旦受损就无法挽回。基于伊利诺伊州法律的效力,用户最近获得了针对脸书“标签建议”功能涉及6.5亿美元的和解方案,该功能在照片中寻找并识别人脸。监督该案的联邦法庭法官称这是“一个具有里程碑意义的结果”,在激烈竞争的数字隐私领域为消费者赢得了重大胜利。

伊利诺伊州是这方面的一个案例,而其他一些州,包括特拉华州、纽约州、得克萨斯州和华盛顿州,已经颁布了某种生物识别隐私法规,或正在制定相关立法,可能会在生物识别数据和其他类型数据的保护方面提供某种程度的隐私保障。在加利福尼亚州,立法者对生物识别信息的定义包括视网膜、虹膜、指纹、面部、掌纹、静脉模式和语音记录的图像,还包括个人的生理、生物或行为特征、击键模式或节奏、步态模式或节奏,以及睡眠、健康或运动数据。国会也曾试图制定国家生物统计学隐私法。

这些法律的存在可能会限制某些涉及隐私的人工智能工作。最近的一起诉讼声称,在网络上抓取个人照片并提取某些生物识别信息以识别个人,“侵犯了隐私并影响言论自由”。据称,涉及的人工智能公司拥有一个数据库,其中包含超过30亿张从社交媒体和其他网站上获取并识别的个人照片,据说该公司与有意识别某些人身份的执法机构分享这些信息。一位知名媒体辩护律师在代表该人工智能公司时,以一种引人深思的平行方式辩称,该公司的行为完全受到《第一修正案》的保护。与此同时,另一家公司为所有用户提供了免费扫描互联网上某个人脸部的能力,到2021年,这一工具“在希望在网络上基本追踪妇女的陌生人中广泛流行”。一位技术研究员告诉《华盛顿邮报》:“这些妇女和其他人,这些将他们的照片放在互联网上的人——他们的孩子、他们的父母、他们生活中可能是脆弱的人,他们这样做不是为了给公司提供可以获利的数据库。”

这带来了一种迂回的方式,即深度伪造技术。在涉及视频的案件中,双方很可能就隐私和言论自由展开争论。这些视频看起来像是他们本人,实际上是由“深度学习”人工智能生成的逼真视频。这种未经授权使用他人面孔和身份的做法曾引起克利夫兰和艾比·罗伯逊的关注。

也许,所有关于生物识别器、互联网扫描照片和深度伪造的讨论能够让名人更容易理解对未经授权照片中隐私的需求。电视真人秀明星科勒·卡戴珊(Khloé Kardashian)曾提出这样的论点:“当有人在光线不好的情况下给你拍了一张不讨喜的照片,或者没有拍到你的身体……你应该有权利要求不与他人分享这种照片。”她在这种情况下是指一张未经她允许的比基尼照片被发布到照片墙上。“我的身体、我的形象,我有权选择如何呈现,我有权选择分享什么内容是属于我的选择。”

这也适用于生活的其他方面,甚至是对死亡的担忧。正如益百利数据共享语言所指出的,一些保险公司现在使用大数据来决定是否以及向客户提供何种人寿保险政策。他们通过借鉴成千上万个数据点来提供更个性化的分析,而不仅仅依靠过时的精算表。换句话说,申请人可能被归类为“快餐店常客”或“健身房常客”,这告诉了他们一些有用的信息。

因此,是的,萨拉斯法官实现了她对隐私的令人心碎的愿望,即涉及她居住地的数据点。新泽西州通过一项法律,在她儿子被谋杀后的四个月内,规定在互联网上或以其他方式披露“现任、前任和退休的司法官员、检察官和执法人员”及其某些家庭成员的家庭住址和电话号码是非法的。尽管面临与第230条的某些冲突,该法律还要求出版商在收到删除请求后的72小时内删除这些信息。

所有这些法院裁决和立法机构通过的法规令人信服地表明,那些希望在某些数据点上保护隐私的人最终将获得保护,甚至可能在家庭地址上也享有某种程度的隐私。实际上,2021年,美国最高法院注意到了这种广泛可获取的数据中的“隐私问题”,并在一起税务案件中表达了担忧,即“任何有计算机能力的人都可以编制关于他人的大量信息,包括家庭地址等敏感细节”。大法官们认为,这种数据汇编为慈善机构的捐赠者带来了“更大的风险”,包括来自“恐吓和淫秽电子邮件”以及“威胁和骚扰”,如“抗议、跟踪和身体暴力”。大法官们决定,这些担忧是如此重要,以至于慈善捐赠者的姓名和地址甚至可以对政府保密。

类似的担忧导致谷歌地图在收到请求时对个人住宅的照片进行模糊处理。脸书也有类似的程序,涉及新闻业务:如果一篇新闻文章“揭示了你的住所所在城市,并显示了你的家或公寓,而你不喜欢这种情况,你可以向脸书投诉”最近的一份报告解释道,此后“脸书将确保没有人可以分享这篇文章”。所有这一切开始听起来非常像欧洲,那里的“数据保护是神圣不可侵犯的”,即使是最微不足道的细节,如地址、工作和年龄,也不允许在未经同意的情况下透露给第三方。

这再次涉及那些可以在网上或可以购买到的冗长档案,其中包括当前的家庭地址和许多其他内容。对于曾被逮捕的人来说,相关数据包括脸部照片将在这200多页中呈现。这将包括成年人的犯罪历史,甚至可能是十年或更久以前的记录,即使此人已经改过自新。

而这引出了美国的被遗忘权这一新兴隐私权利的问题,令人惊讶地在美国崛起。

(本文选摘自《寻找与隐匿:隐私权史的多重面向》一书)

读书推荐

读书导航