酷应用

钟南山团队、腾讯联合研究：AI模型评估这三项措施最有助于防控疫情

百家作者：机器之心 2021-12-21 19:27:06

机器之心发布

机器之心编辑部

关闭学校、关闭工作场所、取消公共活动、限制人群聚集、公共交通管制、居家生活建议、限制国内流动、限制国际旅行…… 到底哪项政策防疫效果更好？钟南山团队与腾讯的联合研究发现了其中的 Top 3。

日前，钟南山院士团队与腾讯公司披露了一项利用大数据与人工智能技术，定量评估不同公共防控政策对新冠疫情控制效果的研究。研究团队开发了一种新的反事实推理模型框架，通过引入隐含交互因子项，最大程度排除了随时间变化的混杂因素的影响，对包含 145 个国家和地区、8 种公共防控政策的动态数据，进行更加准确，且符合真实世界运转的量化分析。

研究结果表明，更快、更精准地实施疫情防控，才能有效遏制新冠肺炎疫情的发展。这也是新冠防控领域首次引入该技术进行研究。

这项研究成果已在国际著名医学期刊 Value in Health（《健康价值》）刊出，题为《Quantifying the Effect of Public Activity Intervention Policies on COVID-19 Pandemic Containment Using Epidemiologic Data From 145 Countries》。

论文链接：https://www.sciencedirect.com/science/article/pii/S1098301521017940

据了解，广州呼吸健康研究院院长何建行和腾讯健康副总裁吴文达为该论文共同通讯作者，钟南山院士为指导作者，广州呼吸健康研究院的梁文华教授、杨子峰教授、曾志奇博士，以及腾讯天衍实验室的孙继超博士、郑冶枫博士为这项新研究的共同第一作者。这也是继去年 2 月，钟南山院士团队与腾讯公司共同成立大数据及人工智能联合实验室，双方在抗击新冠肺炎疫情上的最新研究成果。此前，双方还联合研发了新冠重症 AI 预测系统，有助于合理地为新冠患者进行早期分诊。

“反事实推理模型”：一个基于反事实逻辑设计的算法模型

这项研究中使用的 “反事实推理模型框架” 是 2021 年 7 月由 MIT 和斯坦福大学提出的一种基于机器学习的因果分析模型架构，最初应用于经济促进政策分析（如减税对 GDP 增长的影响）。该模型使用了反事实逻辑进行算法设计，表现为假设 “如果没有…… 就会（不会)……”，通常在公共管理领域用来评估政策影响。以房价控制政策为例，原本 A、B、C 三地房价因为受到温和通胀影响，会按照规律上涨，但突然 A 地限购了，要计算限购的影响，就要将“如果不限购其未来房价数据” 与“实际限购房价的数据”进行比较，得到的差值就是对限购政策影响的评估值。

对本研究而言，简单的理解就是，先用一套机器学习模型，基于所有国家在所有未实施管控政策时的数据构建病毒有效传播数 R_t 的拟合模型，用 “反事实推理模型框架” 来预测某地如果不采取防控措施下（反事实）病毒有效传播数 R_t’值，以及该地实施防控措施后的病毒有效传播数 R_t 真实数据，通过计算两个数据的差值的期望值，得到该防控措施的平均效应值。

但在实际操作中，腾讯天衍实验室的科学家们对原模型进行了更符合 “新冠疫情防控政策” 评估的优化改进（模型公式如图），通过融合多种传统面板数据的因果推断模型，包含双效固定效应模型、矩阵补全模型等，并隐式地引入潜在因子交互项，使其在复杂场景下能满足统计学的先验假设，对于像新冠疫情这样随时间变化的动态数据，能够进行更有效的量化研究，这也是研究者在新冠疫情防控研究开发并引入该模型框架的主要原因。

“新模型”的新用法：能获得更接近真实世界的运算结果

新冠疫情爆发后，全球几乎所有国家和地区都先后实施了不同程度的防控措施。虽然，已有很多研究对各种管控措施遏制疫情的效果进行了分析，但许多传统研究存在国家样本数量小、统计方法过于简单，或只采用传统的因果推断模型（如双效固定效应模型）进行研究，难以应对新冠疫情传播中诸多不可测量的混杂因素影响，比如，不同国家间和地区的经济、文化、交通、人口密度，不同时间点人们自发的防护措施，当地的检测能力不同等，因此导致了统计效能不足，结果偏差较大等问题。

而新的反事实推理模型框架最大的特点是，通过引入时间效应、国家 / 地区效应，以及隐含的交互混杂效应项，以一种隐含因子的方式排除了各种未知的“混杂因子”，最大程度消除了各种动态因素对统计结果的影响。

为了进一步核验该模型的量化结果，科学家们还引入了 Pre-Trend 检验（图）。结果表明，在政策实施前，估计值与真实值残差趋于 0 波动，证明了模型的有效性，这说明在该反事实推理模型框架下量化的管控政策效果是无偏估计量，这也使得在新的 “反事实推理模型” 框架下，研究人员获得的研究结果将更准确、更符合真实世界的疫情发展情况。

研究印证：防控要快且准，三种措施效果最显著

研究人员利用新的 “反事实推理模型” 框架，对全球 145 个国家和地区，包括欧洲 36 个，亚洲 36 个，非洲 47 个，北美 13 个，南美 11 个，大洋洲 2 个进行了研究，跟踪了这些国家 / 地区在 2019 年 12 月 31 日到 2020 年 7 月 1 日新冠病毒在全球掀起第一波大流行期间，普遍采取的 8 种防控措施数据，具体包括：关闭学校、关闭工作场所、取消公共活动、限制人群聚集、公共交通管制、居家生活建议、限制国内流动、限制国际旅行。

结果显示：防控越快，起效越快。研究表明，大多数疫情防控措施在实施后约 7 至 14 天，反映病毒有效传播的“再生数” Rt 会迅速降低，防控效果随着时间的推移而增强，在 25 至 32 天后达到最大抑制效果，Rt 平均降低约 30% 。

反事实推理模型计算出 8 项防控措施实施后不同时间段对 Rt （有效传播数）的抑制效应

研究还指出，在疫情暴发早期（感染缓慢增长期）实施的防控措施，措施越严格、持续时间越长，最终感染人数会越少。但是，处于疫情中后期（感染快速增长期）实施防控措施的话，结果则正好相反——防疫措施越严格，持续时间越久，最终感染人数反而增加。论文第一作者孙继超博士指出，造成这一结果的原因并非疫情防控措施失效，而是反向因果关系导致：到了感染人数快速增长暴发的时候，才开始制定严格的管控措施，此时已经收效甚微。这意味 “亡羊补牢” 为时已晚，在疫情出现苗头的时候尽快行动，才能实现最大效果。

研究结果同时显示：刚性防控，效果更好。取消公共活动、关闭学校、关闭工作场所 3 项措施对疫情控制效果更为显著。研究者推测，这 3 项措施均属强制性措施，执行的可行性更高，因此，更有可能对遏制疫情生效。

反事实推理模型对 8 项管控措施效果的定量评估结果

研究通过大数据分析找到了更可靠的证据，印证了疫情防控措施对抑制新冠肺炎疫情的定量影响，并建议应在疾病流行的早期，实施更严格的疫情防控措施，以更好地遏制疫情。目前，钟南山院士团队和腾讯健康正在持续利用大数据与人工智能等互联网科技手段，围绕新冠预警预测、传染病防控等领域展开深入的科研合作，进一步为疫情防控提供有力的证据支持。

苏黎世联邦理工DS3Lab：构建以数据为中心的机器学习系统

苏黎世联邦理工学院(ETH Zurich) DS3Lab实验室由助理教授张策以及16名博士生和博士后组成，主要致力于两大研究方向，Ease.ML项目：研究如何设计、管理、加速以数据为中心的机器学习开发、运行和运维流程，ZipML项目：面向新的软硬件环境设计实现高效可扩展的机器学习系统。

12月15日-12月22日，来自苏黎世联邦理工学院DS3Lab实验室的11位嘉宾将带来6期分享：构建以数据为中心的机器学习系统，详情如下：