全体疫情期间,人们特殊重视在各国之间(尤其是与中国有关的)关于COVID-19传播的关键信息的共享。
比较之下,关于如何利用过去20年改变了企业面貌的前辈数据技能,来更好地诊治COVID-19的论述很少。
在本文中,我们将谈论政府如何利用这些技能来管理未来的大盛行疾病,乃至可以利用到本次COVID-19疫情的后期阶段。

与大年夜盛行病一较高下人工智能的胜算在哪儿?_数据_模子 文字写作

个性化预测的力量

制订COVID-19应对策略时,决策者可以考虑采取基于个性化需求的预测技能,该技能在过去20年中已改变了许多行业。
数据驱动公司(从“大技能”到金融做事、旅游、保险、零售和媒体)利用机器学习和人工智能技能,针对顾客购买商品等行为提出个性化建议,并根据已有的用户个体数据来进行个性化定价、风险管理和定制信贷等做事。

例如,在最近的《哈佛商业评论》文章中,阿里巴巴前首席计策官曾鸣曾描述其小额贷款业务蚂蚁金服(Ant Financial)是如何通过剖析阿里巴巴电子商务平台上的交易和通讯数据,来实时评估贷款申请人的。
此外,像Netflix等公司会评估消费者过去的选择和行为特色,从而预测其未来的想法和行为。

类似的方法可能适用于预测COVID-19等大盛行病的未来发展轨迹。
利用多种数据源来演习机器学习模型,可以预测严重传染患者的临床风险:在资源有限的情形下,他们须要重症监护治疗的可能性是多少?去世亡的可能性有多大?数据源可能包括患者的个人病史(COVID-19症状的严重程度,彷佛随着患者年事的增长以及诸如糖尿病和高血压等并发症的严重程度而增加)及其家庭组成等。
例如,如果一个康健的年轻人与年迈或体弱多病的人生活在一起,那么他/她就该当被归类为“高风险人群”(否则可能会被归类为“低风险人群”),由于他们一旦传染了其家人,其家人很可能须要接管重症监护治疗。

这些临床风险预测可用于自定义个人/家庭层面的策略和资源分配,以及合理核算标准医疗负债和风险。
例如,它可以识别具有较高临床风险系数的人群,使我们能够针对这部分人群进行干预隔离和保护的同时,许可风险系数较低的人群过上相对正常的生活。
当然,高低风险的判断标准目前尚待确定,其他的风险考量成分还包括可用资源和医疗任务风险等,不过这些数据已有标准的科学统计方法,并已在多种路子中投入利用。

个性化预测大有裨益。
它可以帮助实现低去世亡率的群体免疫,还可以更好、更公正地分配资源,如稀缺的医疗设备(如试剂盒、防护口罩和医院床位)或其他资源。

疫情后期也可以利用类似的方法制订限定解除策略(这是目前大多数国家应对COVID-19疫情的下一个关键步骤)。
决定解除限定方法的先后顺序实质上是一个分类问题,与大多数数据驱动公司的分类问题相似。
一些政府以年事作为风险预测的标准,已经开始逐步解除限定状态,然而这实在是一种相对粗略的分类方法,有可能会遗漏部分高风险人群,如上文提到的与老年人一起生活的康健年轻人。

利用基于数据和人工智能技能的预测模型对人群进行分类,可能会帮助决策者制订解除隔离限定的策略。
这种分类方法在社区层面来说是安全的,且个人和经济成本相对较低。
我们都知道,COVID-19的一个关键特色是其具有极高的传播率,但重症率和去世亡率相对较低。
数据显示,90%以上的传染者只涌现轻微临床症状或不涌现症状。

从理论上讲,如果我们能够精准筛查出这个90%的群体,我们就可以解除这部分人群的限定。
纵然相互传染,他们不会涌现严重症状,医疗系统也不会因不堪重负而崩溃。
解除对这临床风险系数低的人群的隔离限定,也将有助于迅速建立高比例的群体免疫,届时剩余的10%也可以解除隔离限定。

如果预测分数是缺点的,后果将仅发生在最先被解除隔离的“最安全”人群中。
相对付治疗剩下的10%或以上的高危人群,现有的医疗资源更随意马虎承担“最安全”人群的治疗任务。
当然在实践中,我们会从临床风险系数最低的人群开始逐步解除隔离限定,之后随着韶光推移建立群体免疫。

当然,完美的临床风险预测模型是不存在的,就像永久无法完善的医院分诊系统或信贷违约预测模型一样。
然而,不完善的信贷违约预测模型并不妨碍企业和个人的信贷做事,只要这些企业和个人拥有足够高的信用评分,大多是不会违约的。
可以肯定的一点是,COVID-19疫情的临床风险明显高于信贷违约,因此我们须要尽可能担保预测模型的稳健可靠,但这并不虞味着我们完备不去考虑它的可行性。

与稀缺、昂贵并且支配缓慢的医学测试不同,这种临床数据驱动的个性化数字预测办法能够在市场上快速利用,并具有良好的可延展性。
如果能够得到一个精确的预测模型,它将比目前的COVID-19追踪隔离系统更加安全和便捷。
由于目前的COVID-19追踪系统会自动隔离所有传染者及其打仗者,纵然他们是低风险人群。

获取数据

目前,要想获取临床风险预测模型建模所需的数据存在难度。
当然,各国政府可以通过采取更全面的电子病历来网络全国卫生数据,但这些数据不一定是准确的,由于电子病历的历史数据和病毒传播影响的建模须要一定韶光。

本次肺炎疫情已迅速席卷环球,数百万人可能会因此受到影响。
遏制疫情更好的办法可能是环球共创并共建同一个预测模型,利用早期的爆发数据演习该模型。
一个同时包含数万名重症患者(须要重症监护治疗),以及大量轻症患者(只表现轻微症状)的数据集,足以实现某种程度的个性化预测。
日后随着数据增长,预测质量也会逐渐提高。

一旦建立起该模型,就可以在早期传播阶段帮助到其他城市和国家,由于人们在病历中显示的基本生物和生理数据变革不大(每个个体都会变老,且中国武汉的糖尿病数据与美国巴尔的摩的糖尿病数据是一样的)。
如果病毒打击两个人口数量附近的国家,那么它们遭受的结果很可能也是相似的。
以是,这两个国家完备可以利用同一个预测模型,而不必共享演习数据。
当然,由于人口组成(日本的老年人口比墨西哥多)和生活文化等差异(意大利祖父母的儿童养育参与率比德国高),各国之间的数据模式可能会有所不同。
不过,如果为数据开拓和网络设置统一的标准和规范,数据剖析师便可以根据不同的情形设计不同的适应模型。

我们来思考一下这该如何运用到这次COVID-19疫情中:当COVID-19病毒涌如今中国武汉时,是不存在初始数据的,以是基于模型的个性化预测方法是不可行的。
这个时候,封城是具有现实意义的——关闭城市,实施完备保持社会间隔的方法,进行密切监测,除分外情形没有例外。
封城显然有效地遏制了疫情蔓延,也为中国政府创造机会去网络风险预测模型建模所需的演习数据。
中国政府将此数据与其他国家共享,反过来又可以增加自己的演习数据,从而进一步改进预测模型。

隐私权的寻衅

然而,履行创新技能须要重新修订现有的政策。
现有的数据隐私与网络安全政策,以及各个国家的不同标准,将在很大程度上阻碍了我们所提倡的个性化大盛行病管理办法。

这很大一部分缘故原由是由于当前的政策无法辨别输入数据(用于演习模型)、预测模型本身和“输出数据”(基于演习模型的预测结果)。
当某项政策直接或间接地禁止共享数据,或哀求数据储存在某一个特定国家的做事器上时,就会导致所有法律阐明为数据的内容都被隐蔽了(包括模型及其参数)。
因此,我们强烈希望决策者能够明确区分模型共享和数据共享的观点。

我们还鼓励各国政府磋商拟定关于数据共享开放韶光的协议。
例如,在世界卫生组织(WHO)或联合国(UN)宣告某个特定疫情符合构成大盛行病的条件后,正常的隐私法案将暂时停用,各国将被许可共享匿名数据。
在这种情形下,许多人可能乐意破例通过得当且安全的渠道,暂时供应个人数据用以模型演习,这样便可帮助政府制订具有重大生命意义和经济影响的政策。
如果可以实现上述努力,那么当代数据科学和人工智能技能将可以极大地减轻这次大盛行疾病所带来的严重后果,并为下一次大盛行疾病的到来做好充足准备。

Theos Evgeniou、David R. Hardoon、Anton Ovchinnikov |文

Theos Evgeniou,欧洲工商管理学院(INSEAD)决策科学和科技管理教授 。

David R. Hardoon,菲律宾联合银行数据和人工智能高等顾问。

Anton Ovchinnikov,加拿大史密斯商学院管理剖析精彩教授,欧洲工商管理学院(INSEAD)客座教授

投稿及内容互助 | zhenminma@hbrchina.org

广告及商务互助 | luojiajin@hbrchina.org