在麻省理工学院的一项新研究中,卫生研究人员提出了使用实时手机数据追踪和缓解重大疾病爆发的理由。不幸的是,一些障碍——包括隐私问题和缺乏数据立法——可能会阻止这类信息到达研究人员的手中。
今年早些时候,MIT的研究人员开始研究,他们能否通过观察通勤路线,合理地预测一种疾病如何在一座城市传播。通过与新加坡电信新加坡电信的一项协议,MIT的研究人员能够从2011年开始获取4个月的匿名手机定位数据。他们追踪的疾病是2013年爆发的登革热,一种通过蚊子传播的病毒,表现为头痛、肌肉疼痛和呕吐。研究人员推测,这种疾病在城市的传播路径与人们的手机一样。当他们将预测结果与2013年和2014年的人口普查数据进行对比时,他们发现这些模型准确地估计了疾病的增长轨迹。
这项研究之所以引人注目,是因为它能够研究登革热在城市和城镇等较小地区传播的模式。通常,研究人员在更广泛的层面上研究疾病,例如各个州和各个国家。但智能手机的数据可以让研究人员和科学家看到更详细的信息,了解人们与环境以及彼此之间的互动方式。
瑞士洛桑理工学院(Ecole polytechnique federale de Lausanne)的科学家、论文的主要作者Emanuele Massaro说:“这些数据在新形势下非常有用。”他认为,“科学家、非政府组织和政治决策者”应该能够更广泛地获取手机数据,以便更容易控制疾病爆发。
这项研究揭示了个人数据——主要的科技公司如谷歌、Facebook、Verizon和AT&T等电信公司吸收的数据——可以帮助公共卫生研究人员研究下一次重大疾病爆发的途径。但获得这些数据可能会很困难。在全球范围内,人们越来越意识到他们的数据的价值以及大公司使用这些数据的方式。由于担心自己的私人数据被滥用,他们可能会犹豫是否要把数据交给科学家。企业也可能不愿与研究人员或公共卫生官员共享数据,担心将数据匿名化可能还不够私密。尽管如此,研究人员仍在试图解释他们为什么应该这么做,以及如果个人数据得到妥善保护,将如何拯救生命。
利用个人数据
新加坡电信的研究并不是研究人员利用数据追踪疾病的唯一例子。
在2014年几内亚确诊埃博拉病毒爆发前一周,波士顿儿童医院(Boston Children’s Hospital)的研究人员就已经有了担忧的理由。3月14日,他们的网络爬行项目“健康地图”在几内亚南端的Macenta发现了八例由“神秘出血热”引起的死亡。8天后,该共和国确认共有59人死亡,这些死亡与埃博拉病毒有关。
HealthMap成立于2006年,这是一个公共数据健康倡议组织,它展示了数据在预测和跟踪疾病方面的强大力量,而这一切仅仅依靠网络链接。它已经成功地追踪了蒸汽病、登革热、疟疾以及其他各种病毒、皮疹和通过蚊子或老鼠传播的疾病。虽然利用从网络上获取的数据已经做的很不错了,但研究人员认为,智能手机的数据可以帮助他们改变正在发生的一种快速发展的疾病的病程。
“我们确实一直在使用手机。它不仅能跟踪我们的移动速度,还能根据你拥有的设备来跟踪心率,”HealthMap的研究员Yulin Hswen表示。“如果你有特定的应用程序,它可以记录你正在进行的活动。人们也会记录他们吃下去的食物。他们通过手机购物,办理银行业务。”
“你可以得到一个人的全部健康档案和社会档案,所有的数据都来自他们的手机,”Hswen说,有了这样的途径,科学家可以建立个人的预测健康档案,评估一个人患病的可能性,并在第一时间阻止疾病的传播。如果你知道谁容易患病,你可以引导他们采取预防措施,比如疫苗。
隐私问题
但即便是以公共卫生的名义交出这些数据,也相当复杂。尽管各国越来越多地采用隐私保护法规,如欧洲的一般数据保护法规,但对于如何共享这些数据,以及由谁来管理这些数据,仍然没有什么框架。目前还没有好的方法让人们愿意收集自己的数据并随意分享,人们对分享自己的数据也越来越谨慎。
纽约大学斯特恩商学院(New York University 's Stern School of Business)教授、人工智能研究人员Vasant Dhar表示,一些国家正在研究能更容易地为此类项目释放数据的系统。例如,印度正在讨论的一项数据保护法案将创建一个应用程序,人们可以在其中收集和查看自己的数据。它还将为每个账户指定一位“数据受托人”,此人将担任个人数据的守门人。数据受托人,就像金融受托人处理个人资产一样,只会在对个人利益最有利的情况下才会发布数据——也许是为了公共卫生项目。这样的系统将使公司和组织有责任分享手机数据,因此必须做到透明和安全,即使是一个公共疾病追踪项目也必须证明其价值。
Dhar说:“你总是可以构建一个世界末日的场景,很明显你不应该问问题,只是拯救地球,让该死的数据可用,这样我们才能继续生活,但我认为这里需要说明的是,这样做有什么好处?”
手机定位数据虽然对记录实时旅行非常有效,但也有局限性。正如麻省理工学院的研究报告所指出的,手机数据的好坏取决于它的覆盖范围。从本质上说,MIT无法追踪任何一个手机供应商不是新加坡电信的人。然而,研究人员表示,将手机数据与精确的公共卫生数据(如人口普查记录)放在一起,似乎可以纠正这个问题。
还有匿名的问题。在MIT的研究中,新加坡电信为研究人员提供了匿名数据。但是让数据真正匿名的能力还有待商榷。手机数据可以识别你花时间的地方——你的办公室,你的家,你购物的地方——研究人员已经表明,将你的名字与这些细节联系起来相对容易。到目前为止,Facebook在与一个致力于分析该平台如何影响选举的组织分享大量数据方面一直行动迟缓,并将隐私和安全作为其速度缓慢的关键原因。
但这种对数据隐私的担忧是在几次失误之后才出现的。Facebook的错误之一是在2014年进行的一项研究,该研究测试了该平台在未征得用户同意的情况下对近70万名用户进行情绪操控的能力。从那以后的几年里,该平台经常无法保护用户数据。
缺乏透明度
今天,同样是这些公司,他们已经建立了大量的业务,积累个人数据以用于广告目标,并且经常对数据泄露和其他滥用行为满不在乎,他们也正在与医疗机构达成协议。这在很大程度上是有争议的,因为他们经常在黑暗中做这项工作,没有专业的保密知识。
2016年,谷歌的人工智能实验室DeepMind与英国国家卫生服务(NHS)建立了合作关系,但未能提醒患者它正在为这个项目获取他们的记录。在最近的一次溃败中,谷歌与医疗中心网络阿森松开展合作,为其医生开发工具。同样,双方都未能对双方关系或谷歌访问患者数据的能力保持透明。
各国政府在保护消费者数据方面的历史也不尽相同,这可能使Massaro与政治决策者分享数据的愿景难以接受。2015年,一场针对联邦政府人事管理办公室的黑客攻击暴露了2150万人的记录,包括他们的家庭地址、电话号码、社会保障号码和其他高度敏感的信息。而政府机构也有意散布个人信息。今年,据外媒报道,加州机动车辆管理局(California Department of Motor Vehicles)每年通过向Experian和LexisNexus等第三方出售客户数据赚取5000万美元。
鉴于个人数据处理不当的种种方式,研究人员现在担心,人们正在失去对学术和卫生机构的信任,而且将来不太可能自愿提供这些信息。但Massaro说,与私营公司不同,研究人员在保护用户数据方面有严格的规则和道德规范。“如果私人公司拥有你的数据,并能从中赚钱,为什么我们不能永远使用这些数据呢?”
Dhar认为这是一种错误的模式,并指出谷歌不一定拥有它所拥有的个人数据。“这并不意味着它是正确的,也不意味着(研究人员)应该使用它,”Dhar说。
精彩评论