SCI一区论文:基于WiFi信号的病毒存活期内密切接触者追踪
自2019年底开始,新冠疫情的爆发对全球人民的健康与世界经济的发展造成了极大的威胁。及时追踪并隔离病毒的密切接触者在抑制疫情的蔓延中发挥着非常重要的作用。以往密切接触者追踪的方法通常关注与确诊患者有过直接接触的人员,而在近期南京的疫情中,我们发现由于病毒在环境中可存活较长时间,没有与确诊者直接接触但暴露于确诊者逗留过环境中的人员也有很大的感染风险。因此,发掘间接接触的密切接触者也是疫情防控工作中至关重要的一环。
本文将介绍香港科技大学计算机科学与工程系陈双幸教授(Prof. Shueng-Han Gary Chan)团队在SCI一区期刊IEEE Internet of Things Journal发表的关于疫情中密切接触者追踪的最新研究《vContact: Private WiFi-based IoT Contact Tracing with Virus Lifespan》。该论文基于WiFi信号,在保护用户隐私以及考虑病毒可以在环境存活导致间接接触感染的实际情况下,提出了一套基于物联网设备(手机、智能手表、智能手环等)的密切接触者追踪方案。
一、问题背景
新冠病毒的传播对人类的健康与世界经济的发展造成了巨大的冲击。在这次疫情中,病毒的感染主要由于确诊人员接触到周围环境存活的病毒。最近的研究表明,病毒在22℃环境下可存活长达14日,在此期间,任何接触到病毒的人都有被感染的风险。因此,追踪密切接触者并尽快将其隔离对于阻断疫情的蔓延有着重要的作用。考虑病毒的存活时间,我们将密切接触者分为两类,一类是与确诊者同时处于同地直接接触的人员;另一种是在病毒存活期内到访过患者曾经逗留区域的人员(即间接接触)。
传统的密切接触者追踪主要通过医护人员对密切接触者进行流行病学调查,患者凭借记忆回忆自己去过的地方以及接触过的人。然而,这种方法耗时耗力;并且部分患者可能难以立即回忆起自己去过的所有地方以及接触到的人,导致错过最佳的追踪隔离时期。为了辅助人工追踪,2020年以来,各国各地的政府机构与研究单位纷纷提出了自动化的追踪方案。基于GPS以及手机基站信号的方案被广泛采用;但由于GPS与基站数据难以对用户室内位置进行追踪,具有一定的局限性;且GPS与基站数据暴露用户隐私,容易引起公众对隐私暴露的担忧。利用蓝牙配对的方法近年来同样引起了广泛的关注。例如,新加坡政府推出的TraceTogether APP以及谷歌与苹果联合推出的密切接触者追踪方法,都是通过用户手机与周围人群手机的蓝牙配对记录来进行密切接触者的追踪。尽管这种方案能够有效保护用户的隐私,但其只适用于患者面对面直接接触的追踪,对于间接接触的密切接触者则无能为力。
二、vContact密切接触者追踪流程
为解决现有方法的不足,本文提出了一种基于WiFi信号的密切接触者追踪方案,在保护用户隐私的前提下,同时追踪直接接触与间接接触的密切接触者。我们通过图一来介绍该方案的流程:(1)首先,用户安装我们的APP(如图2(a)),该APP每隔一段时间会扫描设备周围的WiFi信号的MAC地址,在对MAC地址进行加密之后,WiFi数据与扫描时间将会被存放在用户设备的本地端。(2)一旦有确诊者出现,如果该确诊者安装了我们的APP,在征得其同意以后,我们将会把该名患者APP记录的WiFi数据以匿名的方式传到服务器端,供其他用户下载;如果该确诊者没有安装我们的APP,那我们则通过安排工作人员到确诊者曾经到访的地方采集WiFi信号,加密后上传到服务器供其他用户下载。(3)用户的APP将会比较下载的确诊者的数据以及存储于本地设备的用户WiFi数据的相似性,从而判断用户是否曾经与接触者有过直接或间接的接触。一旦发现用户有过疑似的密切接触,APP将给用户推送通知(如图2(b))。
图1 利用vContact进行密切接触者追踪的流程
分别表示开启信号采集和疑似密切接触通知
图2 vContact APP示意图
相比较于已有的自动化追踪方案,vContact具有以下优点:(1)考虑了病毒的存活时间,兼顾直接与间接接触两种情况;(2)不依赖于手机与手机之间的匹配,即使确诊者不安装APP,vContact同样可以帮助我们的用户检查是否与确诊者有疑似的密切接触;(3)不记录任何用户信息,除非用户不幸确诊并同意上传数据,所有用户的数据存储与密切接触检查都在用户设备本地端完成,更好地保护用户隐私;(4)不依赖GPS信号,同时兼顾室内室外的复杂环境,同时消除用户暴露自己位置的担忧。
三、密切接触者判断算法
利用WiFi信号来判断两个用户是否存在密切接触存在以下挑战:(1)WiFi数据并不是连续采样的,两次采样之间存在一定的时间间隔(例如数十秒到数分钟),给直接比较相似度带来挑战;(2)不同设备扫描WiFi信号的能力不同,例如不同品牌的手机同时同地采集到的WiFi信号数量以及强度存在差异;即使处于相同位置的同一手机,其不同时刻扫描到的WiFi信号也会存在不同。为了解决以上问题,我们提出了高效的数据预处理方法以及WiFi相似度度量的方法。
3.1数据预处理
我们用Ai表示ti时刻采集到的信号,包含{(a1, s1), (a2, s2), ..., (ai, si), ..., (an, sn)},其中ai表示一个扫描到的WiFi加密后的MAC地址,si表示其信号的强度。
对于用户采集到的离散时间点的WiFi数据,如图三所示,我们通过合并两个相邻时间点的WiFi数据Ai与Ai+1得到对应时间段ti与ti+1之间用户所处区域的WiFi画像。同时,考虑病毒的存活时间,该区域的风险时间段为。
图3 确诊者WiFi数据预处理
对于确诊者没有安装APP的情况,我们通过派遣工作人员到确诊者到访的区域进行WiFi信号采集,并如图四所示合并采集到的信号,得到风险区域的WiFi画像。
图4 风险区域WiFi数据预处理
3.2WiFi相似度度量
我们同时考虑WiFi信号的重合度以及信号强度的差异,提出了一个度量WiFi相似度的方法。如果两个设备的位置越接近,他们所扫描到的WiFi信号重合度越高。因此,给定用户某个时间点的WiFi数据以及确诊者相同时间段的WiFi画像,我们利用以下公式计算它们的信号重合程度:
。
其中,A.a是用户某时刻扫描到的WiFi信号集合,是确诊者相同时间段的WiFi画像,我们用|·|表示信号的数量。此度量方法与Jaccard度量有着相同的分子但不同的分母。在这里之所以要用取代,是为了降低不同设备扫描WiFi数量差异性的影响。
接着我们利用以下公式度量相同信号的强度差异:
,
其中指相同信号在用户与确诊者的WiFi数据中的强度差异。最后,我们将WiFi信号的重合度与相同信号的强度差异结合起来,得到用户的WiFi数据与确诊者的用户画像在时刻t的相似度:
.
当相似度超过一定的阈值时,则认为该用户与确诊者有过密切接触。
四、实验验证
我们分别测试了vContact在办公室、室外公交车站和购物广场三种不同场景与不同的社交距离下的表现,我们采用了准确率(precision)、召回率(recall) 与F-1分数来衡量效果的好坏。如图五所示,我们的方法在不同的安全社交距离下都取得了不错的效果。当安全社交距离大于2m时,方法的效果得到显著提升,其中的原因在于当距离太小时,WiFi信号的变化差异比较小,难分辨出两者是否处于安全的社交距离(更多实验验证与讨论请参考原论文)。
图5 vContact在不同场景下的表现
同时,我们检验了vContact在华为、OPPO、小米等不同品牌手机上的效果,其结果如图六所示。可以看出,在不同品牌不同型号的手机设备上,我们的方法也取得了不错的结果。
图6 vContact在不同品牌手机上的表现
五、小结
本文考虑了对用户隐私的保护以及病毒在环境中的存活时间的实际情况,提出了一个基于WiFi信号的物联网密切接触者追踪方案。该方案包含了直接接触与间接接触两种情况的密切接触者追踪。针对设备信号采样不连续以及采样差异化的问题,我们提出了高效的数据处理方法及一个新颖的WiFi相似度度量方法。我们在室内与室外的不同场景下进行了大量的实验。实验结果表明,我们的方法对于密切接触者的追踪有非常好的效果。同时,利用本文介绍的算法,我们开发了可部署于手机、智能手表、智能手环等IoT设备的APP,用于密切接触者追踪。
0 条评论