论文部分内容阅读
摘 要:通过网络收集调查问卷,根据参加经贸商旅活动人员相关的样本分析,运用计算新冠疫情感染风险指数的平均处置数值(ATE及ATT),使用倾向值的匹配和逆概率加权等数学模型推算并计算出感染风险指数。研究表明,疫情之下错峰出行、远程办公、科学开放相关数据平台是人们安全生活和工作的一种选择。
关键词:新冠疫情 ATE及AT 倾向值 逆概率 感染风险指数
一、疫情风险指数
(一)疫情与经济活动
新冠疫情在一些地区虽仍旧呈现波浪起伏之势,但当疫情处于平稳时,人们集中外出恢复正常的社会经济活动成为必然。经贸商旅活动主要包括公共场所消费、大型展销会、贸易洽谈会等,及时了解、掌握新冠疫情感染风险的相关指标信息,对防疫和恢复生产、生活具有重要意义。在日本,2020年初春新冠疫情发生,随之而来国内的经济活动显示出急剧衰退迹象。为了应对急速的经济衰退和病毒感染现象,政府于4月20日通过了累计规模为25兆6910亿日元的第一次补充预算,目的是促进疫后的经济复苏,特别是作为刺激经济受到影响的经贸商旅、交通业、饮食业、住宿、娱乐业的需求。其中“Go To宣传活动”的预算额为1兆6774亿日元。这项活动对消费会给予优惠券、折扣、积分返还等,根据行业被临时称为“Go To 旅游”“Go To 吃饭”“Go To 活动”“Go To逛商店街”等。
随着旅游旺季的到来,从10月1日开始GoTo业务开始实施。然而到11月,之前的疫情稳定状态突变,新感染确诊人数开始急剧上升。人们经贸商旅活动与新型冠状病毒感染的扩大是否相关,则成为目前讨论研究的热点。但经贸商旅这一比较集中的活动究竟对扩大感染有哪些影响则需要进一步研究和论证。本研究以进行问卷调查数值为基础,对经贸商旅活动与新型冠状病毒感染带来的影响进行计量分析。[1]
(二)调查研究方案
1.初步调查阶段与指标选择。初步调查时间段为2020年8月末到9月末,共收集到约为28000例大规模样本,对其中有经贸商旅活动经历和过去一个月内疑似新型冠状病毒的五种症状(发热、咽痛、咳嗽、头痛、嗅觉/味觉异常)之间的相关性进行了多变量分析。特别是为了消除问卷调查的信息和人们生活基础调查的信息发生误差,避免问卷调查回答的偏差,将处置变量进行逆概率加权推算。
研究首先调查并分析了8月或9月一天以上的经贸商旅活动和新冠疫情病毒感染的确诊之间的相关程度,通过多元逻辑回归分析和验证表明,一天以上的经贸商旅活动和新冠病毒感染的确诊之间有着明显的关联。并且过去一个月的新冠疫情与感染病毒有关的8个症状(发烧、咳嗽、喉咙痛、乏力、呼吸困难、味觉、嗅觉障碍、腹泻)与经贸商旅活动有着正相关联。[2]本研究在上述两个研究和以下方面采用了新的研究方法。首先将是否有新冠疫情感染的确诊作为主要实际指标来进行分析。因为是自己申报的数据,其中包含了关于新冠疫情感染确诊的有无信息数据,显得非常宝贵。为了把握样本整体经贸商旅活动与新冠疫情感染之间的相关性,本研究采用了从模拟错误设定的偏差到相对健全的趋势加权分析,分析了经贸商旅活动和新冠疫情感染经历以及感染症状出现的相关性。此外,不仅对整个样本的平均数值进行了测量,还对样本按属性划分后的子样本进行了分析,从多方面验证了经贸商旅活动受到感染风险的影响,对以上相关数据按照相应的数学模型进行推算,其计算结果的数值就是疫情的各类风险指数。
2.实际调查时间阶段与样本数据的选择。实际调查是从2020年10月27日到11月6日之间进行,在发放消费券、优惠券、折扣券时,以自愿为原则,进行网络问答。调查对象是全国18~74岁的男性和女性,期望回答人数达到约1万5千人。在参加该调查的应征者中,同意参加本研究,并且全部回答,或者尽量回答的人数有19340名。最终有效回答人数为16642人。在问卷调查中,除了性别、年龄、居住地、婚姻、同居形态等社会属性外,还有收入、资产、就业状态、职业、工作形态、学历等经济属性。此外还包括接触熟人、朋友以及外在交流次数、在线交流、外出频率、新冠疫情感染预防知识等行为方式,有没有基础疾病和精神健康状态相关的状况也被提出。在这些之外又加上是否被确诊为感染了新冠病毒和是否出现新冠病毒感染有关联的各种症状(发烧、咳嗽、喉咙痛),针对是否经历过慵懒、呼吸困难、味觉、嗅觉障碍、腹泻等问题。还提出了是否在2020年8月至9月期间进行过一次以上的经贸商旅活动(包括回家探亲)的问题。有些將成为在子样本部分详细描述分析中使用的变量。这两项调查是经过特定医疗法人社团的伦理审查委员会的批准后进行的。[3]
二、公式和数学模型
(一)感染风险指数的分析方法
1. ATE、ATT、倾向值。本研究对经贸商旅活动中出现的新型冠状病毒感染,或者疑似感染所产生的各种症状对其产生的程度影响,以及因果相关性进行统计计算。把经贸商旅活动的有无作为处置变数,处置变量是指调查者通过改变一个或几个变量的方式(称为处理),测量它们对另一个或几个变量的影响。对感染及疑似症状的数值来进行计算。具体来说,考虑以下两种数值。个人i是否有经贸商旅活动作为潜在处置变量、用ti=1,0、表示、根据个人i的数值用yi(ti)表示,则经贸商旅活动感染和疑似感染症状的平均值为(公式1):
其平均处置数值(Average Treatment Effect,ATE)表明所有的观察对象在参于经贸商旅活动的情况下,平均感染风险和疑似症状出现的风险程度。[4]
作为与此相关联的因果效应,不是对潜在发生问题的处置,而是现实发生并被观察到的实际作为处置变量、用zi=1,0、表示、其平均处置数值(Average Treatment Effect on the Treated, ATT)为(公式2): 这表明,把实际去经贸商旅活动的人作为观察对象计算,根据经贸商旅活动的不同,其平均感染风险和症状出现的风险会高要高一些。
如果潜在处置变量和实现处置变量不同时,即
(ti=0并且zi=1,或者ti=1并且zi=0的情况下), 正确识别平均处置数值变得有些困难。如果经贸商旅活动者和没有经贸商旅活动者之间的属性分布存在较大差异时,则不能简单地比较感染率大小。
公共变量是一种全局变量,为了观察每个对象的属性,采用根据公共变量向量xi预测处置概率,计算出倾向值(propensity score),倾向值是一种有一定条件的概率值,可以减少计算的误差。 见(公式3)
如果满足以倾向值所给的条件xi的话,实际处置变量zi独立。见(公式5、6)
因此,可以通过调节倾向值来控制实际处置变量给定的数值偏差。 由此,预期数值是:(公式7、8)
ATE和ATT的最终表达式意味着可以通过计算实际的动作变量分别为1或0时观察到的数值的倾向值,作为条件来计算平均值,根据平均值来计算平均处置数值。
在此分析中,倾向值e(xi)是处置变量(实际参加经贸商旅活动),将其定为说明变量、通过回归分析方法推算出公共变量、根据对经贸商旅活动会带来新冠病毒的感染和疑似感染症状的调查统计,来计算ATE和ATT值。[5]
(二)变量的选择与设计
首先是处置变量,作为处置变量,是计算以参加经贸商旅活动为主的变量。经贸商旅活动还包括:在商场购物、集中餐饮、亲友结伴互访、旅游住宿、文化娱乐等活动。根据是否是一次或一天以上的活动时间来设定处置变量。另外在调查问卷中,因为调查经贸商旅活动时间是2020年8月和9月,所以必须注意经贸商旅活动出发和到达时间。
其次是公共变量,公共变量除了年龄、性别、、身高和体重之外,还设置了以下所示的各种新变量。关于含税家庭年收入、与家庭收入有关的这一年家庭收入的变化、家庭存款(包括股票债权)等,其中,关于家庭收入和家庭资产的问题,设计了处置变量和效果变量双方之间的因果关系。处置变量包括对经济能力是否具有到高级消费地点的说明,效果变量是用来计算新冠疫情感染的程度,目前观察到越是低收入者越容易存在新冠疫情感染的风险。
关于就业状况,考虑到调查问卷中的以下问题:第一:经贸商旅活动后如果确诊感染了新冠疫情病毒,是否有可能以此为理由选择在家待命或停职,作为家庭相关的变量;第二:考虑到家庭代际关系,作为新冠疫情感染及感染症状出现,除了本人以外的家庭成员外,同时还应考虑到家庭成员选择参加经贸商旅活动时的成本和机会成本。
作为表示身边人际关系有关的变量,有以下两个问题:这些不仅仅是有关是否愿意参加经贸商旅活动的意愿决定,也有影响感染风险相关信息的公告以及亲友对他人行动的劝告等。
关于住宅形态的问题和关于是否有住房贷款的剩余债务问题组合起来,设定汇总到“没有住房贷款”“有住房贷款”“租赁住宅和其他”分类的参数变量里。
关于基础疾病的有无,在此设定了排除“不符合”和“肺和呼吸道疾病”选项,是为了避免与作为外部变量的新冠疫情感染的时间序列发生冲突。
关于学历,将调查的回答数值整合成“初中高中毕业”“短期大学专业毕业”“大学、大学院(研究生)毕业”3个类别。
(三)逆概率加权推算ATE
在这项研究中,对发生新冠疫情感染和感染症状的风险的平均处置数值执行逆概率加权推算(Inverse Probability Weighting, IPW)以获得ATE。 IPW使用倾向值作为样本中每个观察值数值的权重,以及处置整个样本时的期待值和样本整体未处置的期待值,通过差额计算来推算ATE。具体而言,将倾向值的倒数1/用作权重。由于倾向值的倒数随着倾向值的减小而变大,因此在处置组中,倾向值越大的观察值的权重越小,在对照组中,倾向值越大的权重也越大。换句话说,在处置组和对照组的各自的内部中,观察值越稀少并且样本中的比例越小,则计算出的权重越重。[6]如果实际处置变量为1时(zi)=1,那么可以推算出潜在数值的期望值为:(公式11)
(四)根据倾向值匹配推算ATT
本研究进一步使用倾向值匹配(Propoensity Score Matching,PSM)對经贸商旅活动发生新冠病毒感染及感染症状出现风险的人群的平均处置数值进行推算。PSM是使倾向值大致相同值的处置组和对照组的观测值进行匹配,以两者平均差作为因果相关的推定值。作为匹配的基准是采用最近邻样本匹配。进行ATT推算的根据是以严格考察实际经贸商旅活动者对新冠疫情感染扩大的程度和数值进行定量评价为目的,对经贸商旅活动潜在新冠疫情感染能扩大到什么程度、在哪里扩大进行分析。经贸商旅活动的感染风险一般认为是前者。
ATE和ATT一般不会一致。其主要原因是处置群和对照群的人群之间,具有某种性质的不同。如果经贸商旅活动的ATT比ATE大的话,实际经贸商旅活动的人群是相对高风险的人群。相反的话,相对低风险的人选择了经贸商旅活动,或者ATT和ATE之间没有显著的差别的话,经贸商旅活动相对安全了。
(五)子样本的设计
在本研究中,除了使用问卷调查的全部样本进行分析之外,还根据属性进行子样本划分分析。具体使用以下属性的子样本。
首先,用不同年代的子样本进行IPW的ATE推算和PSM的ATT推算。使用10、20、30岁的“年轻一代”、40、50岁的“中年一代”、60、70岁的“老年一代”的各子样本。在经贸商旅活动中,因为预计不同年代的消费方式会有很大的不同,所以计算各个年代经贸商旅活动的平均处置数值是很重要的。 其次,用性别的子样本进行IPW的ATE推算和PSM的ATT推算。目前虽然有很多男性确诊为新型冠状病毒感染者的报告,通过经贸商旅活动来确诊感染扩大是否也能维持这种趋势性的可能?所以研究又设计了感染扩大地区的居民和非扩大地区的居民之间的子样本。经贸商旅活动是伴随着人的移动,感染者从感染扩大地区流入非扩大地区(包括无症状者),或者从非扩大地区到感染扩大地区经贸商旅活动,从而引发感染,为了防止病毒扩散又带回到扩大地区使感染扩大化,因此对各个地区的经贸商旅活动者出发前所面临的感染风险也要进行一定的评价。最后根据样本中每个人的私人沟通频率进行了划分,具体使用了以下问题:比如一周一次以上、与工作以外的熟人、亲属、朋友等直接见面构成一个子样本。
三、计算结果与分析
本节表示IPW的ATE推算和PSM的ATT推算的数值。
(一)ATE推算
首先,从逆概率加权估计的平均处置数值对ATE的推算数值表示。这里所示的数值是整个样本的平均处置数值,这显示了如果作为调查对象的样本内的所有人都去经贸商旅活动的话,平均会提升多少效果。
1.对全体样本的分析(ATE)。全体样本中新型冠状病毒感染及感染症状出现(新型冠状病毒感染经历、37.5度以上的发热、严重咳嗽、喉咙痛、强烈的无力)经贸商旅活动的平均处置数值推算数值表示可信区间达到95%,经贸商旅活动可以达到5%的显著差别的平均处置数值。
根据推算,经贸商旅活动对于新冠疫情感染经历有1%左右的平均处置数值。其他样本大体上确诊了具有正确的平均处置数值,但是在“严重的咳嗽”和“腹泻”方面没有发现明显的差别。
2.根据不同年龄段的样本进行分析(ATE)。显示了将推算作为不同年代的子样本的数值。首先通过年轻一代(十岁到三十岁)的推算数值表明,经贸商旅活动的平均处置数值非常高。有新冠疫情感染经历数值是1.7%,高于所有样本1.0%的平均值。
在中年一代(四十多岁到五十多岁)的样本中,得出了以下数值,首先与年轻一代相比,对所有有效果的平均处置数值较低。有新冠疫情感染经历也只占1%,与整体水平相比没有变化。
在老年一代(60岁到70岁)的样本中,得出了以下数值,首先,有新冠疫情感染经历,其平均处置数值降低到0.3%。另外整体数值量较小。
3.性別样本分析(ATE)。男性数值量非常高的项目很多,除了咳嗽和腹泻没有显著意义外,其它对新冠疫情感染的平均处置数值是1.8%,数值比较高。与男性相比,女性数值明显较小,而且效果不明显(发热、咳嗽、倦怠感不明显)。有新冠疫情感染是0.4%,这个是男性的1.8%的2/9左右的大小。
4.感染扩大地区、非扩大地区的分析(ATE)。这里表示样本回答者回答是否居住在感染扩大地区。这里的感染扩大地区需要注意大部分都是大都市圈,确诊感染扩大地区的新冠疫情感染平均处置数值高达1.4%。与感染扩大地区的数值相比,非感染扩大地区整体数值小,而且发热、喉咙疼痛、味觉嗅觉障碍、腹泻等方面也消失了。平均处置数值为0.4%,大小在感染扩大区的1/3以下。
5.根据交流频率的分析(ATE)。IPW的ATT推算的最后,用以调查对象的交流频度划分样本时的子样本进行。具体来说,一周一次以上,通过与工作以外的熟人、亲属、朋友等直接见面组成样本,分别进行分析。首先是每周进行一次以上交流的人群。整体显示出较高的数值和有效性,特别是有过新型冠状病毒感染经历,平均处置数值为2.1%,是目前为止最高的水平。[7]
(二)趋势值匹配
根据对趋势值匹配推算来说,用平均处置数值ATT的推算数值来表示。这里所示的数值是经贸商旅活动人的平均处置数值,调查对象的样本是实际从事经贸商旅活动的人与没有出去从事经贸商旅活动进行比对,表示平均处置数值的可信度。
1.对全体样本分析(ATT)。样本全体使用新型冠状病毒感染及感染症状出现(新型冠状病毒感染经历、37.5度以上的发热、严重咳嗽、喉咙痛、强烈无力、呼吸困难、味觉障碍、腹泻),共8个症状。根据推算,有经贸商旅活动新型冠状病毒感染经历的ATT为1.3%,大于ATE的1%。
2.根据不同年龄段的样本进行分析(ATT)。结果显示ATT对不同年龄段的子样本的推算数值。首先对年轻一代(十岁到三十岁)推算数值。年轻一代的ATT非常高。有新冠疫情感染经历达到2.7%。中年一代(四十多岁到五十多岁)的样本中,果然和年轻一代相比,ATT在所有效果方面都比较低,新冠疫情感染数值是0.9%,这与ATE的1%基本相同。在老年一代(60多岁到70多岁)的样本中,所有有效性数值都很小,由此可以推测出老年一代风险相对较小,是因为他们有选择性地去参加经贸商旅活动。
3.性别样本分析(ATT)。对性别样本的推算数值。首先是关于男性对新冠疫情感染的ATT高达2.3%,超过ATE的1.8%。接下来确诊限定于女性的样本分析数值。与男性相比数值明显较小,除了新冠疫情感染数值以外,其他所有的数值都不显著,其新冠疫情感染ATT为0.8%,这是男性的2.3%的1/3左右的大小。
4.感染扩大地区、非扩大地区的分析(ATT)。首先,确诊感染扩大地区的数值和ATE一样,整体数值很高。有新冠疫情感染经历的平均处置数值是1.8%,比ATE的1.4%高一些。接下来,确诊非感染扩大地区的数值。与感染扩大地区的数值相比,整体数值小,对新冠疫情感染ATT为0.7%,较ATE的0.4%稍高。
5.交流频率分析(ATT)。在PSM的ATT推测的最后,以调查对象的交流频率(一周一次以上,是否与工作以外的熟人、亲属、朋友等直接见面)划分样本的子样本进行推算。整体显示出较高的数值有效性,特别是有新型冠状病毒感染经历的ATT为3%,高于ATE的2.1%,是本研究中最高的水平。[8] 四、总结与对策
(一)总结
根据本研究的推算数值可以看到:第一,经贸商旅活动感染风险高的是年轻人、男性、住在感染扩大地区、与朋友熟人直接接触的人。相反,对于老年一代、女性、非感染地區居住、自觉控制与熟人直接接触的人来说,相对低风险;第二,对参加经贸商旅活动有新冠疫情感染的ATT推算值与ATE推算值进行比较,ATT推算值整体较高,这表明实际选择经贸商旅活动的人在整个样本中可能是相对风险较高的人。但是其中老年人和平时就控制和熟人直接接触的人来说,ATE和ATT有很大的区别,或者ATT比较小,符合相对风险较低的选择性从事经贸商旅活动的趋势。第三,老年人感染风险低是因为目前基本退休在家,平日能够避开人群比较集聚的经贸商旅活动,如果在消费券补助发放中附加错峰出行的条件话,有可能更加安全。[9]
(二)对策
1.错峰和距离。通过禁止外出、限制移动等社会隔离政策对抑制感染症暂时有效,但对整个社会经济活动会产生巨大负面影响,今后研究“健康与发展之间的平衡”迫在眉睫。很多国家对新冠疫情政策效果进行事后评价和实证研究也确认了至少在短期内也存在这种关系。也就是说在新冠疫情结束之前,必须在抑制感染与社会经济活动平衡中进行选择。[10]比如,如果以淡季的住宿旅行为对象的话,通过扩大与繁忙期的价格差来促进不同时期的错峰消费,有助于住宿业和运输业的需求平均化。同时需求分散也有抑制设施内和移动过程中的人流密集,降低感染风险。避免职场和上下班的密集成为了一个现实问题。错峰上班和在家远 程办公是一个有效的方法,如果利用一半左右的带薪休假来分散休息日的话,也有抑制职场密集度的作用。在错峰上班增加的情况下,也提倡错峰休假和错峰旅行。
2.科学开放数据。在防止新型冠状病毒的感染扩大方面,科学数据也能发挥重要作用。第一,建立公开的关于“新型冠状病毒预防感染网站”。网站相关信息一目了然地可视化。第二,在各自展示数据的同时,民众可对各种感染状况进行讨论,为相关机构及时提供信息;第三,基于公开的数据,可以对其进行计量分析,并及时实时公布各个属性的风险指数,以便指导人们活动方向。
3.心理调整与“口罩”指数。很多人认为“由于发生疫情原因,人们担心外出安全,导致对服务业的需求下降”,但是最近的一些研究否定了这一观点。东京大学教授渡边认为:在心理学的实验中,恐惧心理的强弱和感染对策的行动(抑制外出或戴口罩等)之间有很强的相互关系,被称为影响需求的“外出戴口罩”因素。戴口罩可以预防感染,但是也影响人们外出行为的心理。如果在计算感染风险指数中,抽出一部分相关样本数据,适时公布预防感染戴口罩安全指数,指导人们在不同时间、场合、地点戴口罩的合理性,可大大缓解人们的心理压力。比起抗击疫情的“效率”价值,提高“安全、安心”的价值才是战胜“心理恐惧”的最佳方案。
参考文献:
[1]Miyawaki, A., et al., Association between Participation in Government Subsidy Program for Domestic Travel and Symptoms Indicative of COVID-19 Infection. [R] medRxiv, 2020: p. 2020.12.03.20243352.
[2]Mansournia, M.A., et al.,Separation in Logistic Regression: Causes, Consequences, and Control.
[J]American Journal of Epidemiology, 2017. 187(4): p. 864-870.
[3]Allison, P.D. Convergence failures in logistic regression. [C]in SAS Global Forum. 2008.
[4]Firth, D., Bias Reduction of Maximum Likelihood Estimates. [J] Biometrika, 1993. 80(1): p. 27-38.
[5]Greenland, S., M.A. Mansournia, andD.G. Altman, Sparse data bias: a problem hiding in plain sight. [M] BMJ, 2016. 352: p.
[6]Coveney, J., FIRTHLOGIT: Stata module to calculate bias reduction in logistic regression. [C] 2015. [7]Pierce, M., et al., Says who? The significance of sampling in mental health surveys during COVID-19. [J] The Lancet Psychiatry, 2020. 7(7): p. 567-568.
[8]Chauvenet, A., et al., Panel sampling in health research. [J] The Lancet Psychiatry, 2020. 7(10): p. 840-841.
[9]Dominik Johannes, L., Too Fast, too Straight, too Weird: Non-Reactive Indicators for Meaningless Data in Internet Surveys. [J] Survey Research Methods, 2019. 13(3).
[10][ZK(]Morikawa, Masayuki "Demand Fluctuations and Productivity of Service Industries." [N] Economics Letters,2012. 117(1), pp. 256-258.
〔本文系文化和旅游部2019年“‘雙师型’人才培养项目”(项目编号:WLRCS2019-070)研究成果〕
〔金浏河,温州职业技术学院。陈贤敏(通讯作者),浙江工贸职业技术学院〕
关键词:新冠疫情 ATE及AT 倾向值 逆概率 感染风险指数
一、疫情风险指数
(一)疫情与经济活动
新冠疫情在一些地区虽仍旧呈现波浪起伏之势,但当疫情处于平稳时,人们集中外出恢复正常的社会经济活动成为必然。经贸商旅活动主要包括公共场所消费、大型展销会、贸易洽谈会等,及时了解、掌握新冠疫情感染风险的相关指标信息,对防疫和恢复生产、生活具有重要意义。在日本,2020年初春新冠疫情发生,随之而来国内的经济活动显示出急剧衰退迹象。为了应对急速的经济衰退和病毒感染现象,政府于4月20日通过了累计规模为25兆6910亿日元的第一次补充预算,目的是促进疫后的经济复苏,特别是作为刺激经济受到影响的经贸商旅、交通业、饮食业、住宿、娱乐业的需求。其中“Go To宣传活动”的预算额为1兆6774亿日元。这项活动对消费会给予优惠券、折扣、积分返还等,根据行业被临时称为“Go To 旅游”“Go To 吃饭”“Go To 活动”“Go To逛商店街”等。
随着旅游旺季的到来,从10月1日开始GoTo业务开始实施。然而到11月,之前的疫情稳定状态突变,新感染确诊人数开始急剧上升。人们经贸商旅活动与新型冠状病毒感染的扩大是否相关,则成为目前讨论研究的热点。但经贸商旅这一比较集中的活动究竟对扩大感染有哪些影响则需要进一步研究和论证。本研究以进行问卷调查数值为基础,对经贸商旅活动与新型冠状病毒感染带来的影响进行计量分析。[1]
(二)调查研究方案
1.初步调查阶段与指标选择。初步调查时间段为2020年8月末到9月末,共收集到约为28000例大规模样本,对其中有经贸商旅活动经历和过去一个月内疑似新型冠状病毒的五种症状(发热、咽痛、咳嗽、头痛、嗅觉/味觉异常)之间的相关性进行了多变量分析。特别是为了消除问卷调查的信息和人们生活基础调查的信息发生误差,避免问卷调查回答的偏差,将处置变量进行逆概率加权推算。
研究首先调查并分析了8月或9月一天以上的经贸商旅活动和新冠疫情病毒感染的确诊之间的相关程度,通过多元逻辑回归分析和验证表明,一天以上的经贸商旅活动和新冠病毒感染的确诊之间有着明显的关联。并且过去一个月的新冠疫情与感染病毒有关的8个症状(发烧、咳嗽、喉咙痛、乏力、呼吸困难、味觉、嗅觉障碍、腹泻)与经贸商旅活动有着正相关联。[2]本研究在上述两个研究和以下方面采用了新的研究方法。首先将是否有新冠疫情感染的确诊作为主要实际指标来进行分析。因为是自己申报的数据,其中包含了关于新冠疫情感染确诊的有无信息数据,显得非常宝贵。为了把握样本整体经贸商旅活动与新冠疫情感染之间的相关性,本研究采用了从模拟错误设定的偏差到相对健全的趋势加权分析,分析了经贸商旅活动和新冠疫情感染经历以及感染症状出现的相关性。此外,不仅对整个样本的平均数值进行了测量,还对样本按属性划分后的子样本进行了分析,从多方面验证了经贸商旅活动受到感染风险的影响,对以上相关数据按照相应的数学模型进行推算,其计算结果的数值就是疫情的各类风险指数。
2.实际调查时间阶段与样本数据的选择。实际调查是从2020年10月27日到11月6日之间进行,在发放消费券、优惠券、折扣券时,以自愿为原则,进行网络问答。调查对象是全国18~74岁的男性和女性,期望回答人数达到约1万5千人。在参加该调查的应征者中,同意参加本研究,并且全部回答,或者尽量回答的人数有19340名。最终有效回答人数为16642人。在问卷调查中,除了性别、年龄、居住地、婚姻、同居形态等社会属性外,还有收入、资产、就业状态、职业、工作形态、学历等经济属性。此外还包括接触熟人、朋友以及外在交流次数、在线交流、外出频率、新冠疫情感染预防知识等行为方式,有没有基础疾病和精神健康状态相关的状况也被提出。在这些之外又加上是否被确诊为感染了新冠病毒和是否出现新冠病毒感染有关联的各种症状(发烧、咳嗽、喉咙痛),针对是否经历过慵懒、呼吸困难、味觉、嗅觉障碍、腹泻等问题。还提出了是否在2020年8月至9月期间进行过一次以上的经贸商旅活动(包括回家探亲)的问题。有些將成为在子样本部分详细描述分析中使用的变量。这两项调查是经过特定医疗法人社团的伦理审查委员会的批准后进行的。[3]
二、公式和数学模型
(一)感染风险指数的分析方法
1. ATE、ATT、倾向值。本研究对经贸商旅活动中出现的新型冠状病毒感染,或者疑似感染所产生的各种症状对其产生的程度影响,以及因果相关性进行统计计算。把经贸商旅活动的有无作为处置变数,处置变量是指调查者通过改变一个或几个变量的方式(称为处理),测量它们对另一个或几个变量的影响。对感染及疑似症状的数值来进行计算。具体来说,考虑以下两种数值。个人i是否有经贸商旅活动作为潜在处置变量、用ti=1,0、表示、根据个人i的数值用yi(ti)表示,则经贸商旅活动感染和疑似感染症状的平均值为(公式1):
其平均处置数值(Average Treatment Effect,ATE)表明所有的观察对象在参于经贸商旅活动的情况下,平均感染风险和疑似症状出现的风险程度。[4]
作为与此相关联的因果效应,不是对潜在发生问题的处置,而是现实发生并被观察到的实际作为处置变量、用zi=1,0、表示、其平均处置数值(Average Treatment Effect on the Treated, ATT)为(公式2): 这表明,把实际去经贸商旅活动的人作为观察对象计算,根据经贸商旅活动的不同,其平均感染风险和症状出现的风险会高要高一些。
如果潜在处置变量和实现处置变量不同时,即
(ti=0并且zi=1,或者ti=1并且zi=0的情况下), 正确识别平均处置数值变得有些困难。如果经贸商旅活动者和没有经贸商旅活动者之间的属性分布存在较大差异时,则不能简单地比较感染率大小。
公共变量是一种全局变量,为了观察每个对象的属性,采用根据公共变量向量xi预测处置概率,计算出倾向值(propensity score),倾向值是一种有一定条件的概率值,可以减少计算的误差。 见(公式3)
如果满足以倾向值所给的条件xi的话,实际处置变量zi独立。见(公式5、6)
因此,可以通过调节倾向值来控制实际处置变量给定的数值偏差。 由此,预期数值是:(公式7、8)
ATE和ATT的最终表达式意味着可以通过计算实际的动作变量分别为1或0时观察到的数值的倾向值,作为条件来计算平均值,根据平均值来计算平均处置数值。
在此分析中,倾向值e(xi)是处置变量(实际参加经贸商旅活动),将其定为说明变量、通过回归分析方法推算出公共变量、根据对经贸商旅活动会带来新冠病毒的感染和疑似感染症状的调查统计,来计算ATE和ATT值。[5]
(二)变量的选择与设计
首先是处置变量,作为处置变量,是计算以参加经贸商旅活动为主的变量。经贸商旅活动还包括:在商场购物、集中餐饮、亲友结伴互访、旅游住宿、文化娱乐等活动。根据是否是一次或一天以上的活动时间来设定处置变量。另外在调查问卷中,因为调查经贸商旅活动时间是2020年8月和9月,所以必须注意经贸商旅活动出发和到达时间。
其次是公共变量,公共变量除了年龄、性别、、身高和体重之外,还设置了以下所示的各种新变量。关于含税家庭年收入、与家庭收入有关的这一年家庭收入的变化、家庭存款(包括股票债权)等,其中,关于家庭收入和家庭资产的问题,设计了处置变量和效果变量双方之间的因果关系。处置变量包括对经济能力是否具有到高级消费地点的说明,效果变量是用来计算新冠疫情感染的程度,目前观察到越是低收入者越容易存在新冠疫情感染的风险。
关于就业状况,考虑到调查问卷中的以下问题:第一:经贸商旅活动后如果确诊感染了新冠疫情病毒,是否有可能以此为理由选择在家待命或停职,作为家庭相关的变量;第二:考虑到家庭代际关系,作为新冠疫情感染及感染症状出现,除了本人以外的家庭成员外,同时还应考虑到家庭成员选择参加经贸商旅活动时的成本和机会成本。
作为表示身边人际关系有关的变量,有以下两个问题:这些不仅仅是有关是否愿意参加经贸商旅活动的意愿决定,也有影响感染风险相关信息的公告以及亲友对他人行动的劝告等。
关于住宅形态的问题和关于是否有住房贷款的剩余债务问题组合起来,设定汇总到“没有住房贷款”“有住房贷款”“租赁住宅和其他”分类的参数变量里。
关于基础疾病的有无,在此设定了排除“不符合”和“肺和呼吸道疾病”选项,是为了避免与作为外部变量的新冠疫情感染的时间序列发生冲突。
关于学历,将调查的回答数值整合成“初中高中毕业”“短期大学专业毕业”“大学、大学院(研究生)毕业”3个类别。
(三)逆概率加权推算ATE
在这项研究中,对发生新冠疫情感染和感染症状的风险的平均处置数值执行逆概率加权推算(Inverse Probability Weighting, IPW)以获得ATE。 IPW使用倾向值作为样本中每个观察值数值的权重,以及处置整个样本时的期待值和样本整体未处置的期待值,通过差额计算来推算ATE。具体而言,将倾向值的倒数1/用作权重。由于倾向值的倒数随着倾向值的减小而变大,因此在处置组中,倾向值越大的观察值的权重越小,在对照组中,倾向值越大的权重也越大。换句话说,在处置组和对照组的各自的内部中,观察值越稀少并且样本中的比例越小,则计算出的权重越重。[6]如果实际处置变量为1时(zi)=1,那么可以推算出潜在数值的期望值为:(公式11)
(四)根据倾向值匹配推算ATT
本研究进一步使用倾向值匹配(Propoensity Score Matching,PSM)對经贸商旅活动发生新冠病毒感染及感染症状出现风险的人群的平均处置数值进行推算。PSM是使倾向值大致相同值的处置组和对照组的观测值进行匹配,以两者平均差作为因果相关的推定值。作为匹配的基准是采用最近邻样本匹配。进行ATT推算的根据是以严格考察实际经贸商旅活动者对新冠疫情感染扩大的程度和数值进行定量评价为目的,对经贸商旅活动潜在新冠疫情感染能扩大到什么程度、在哪里扩大进行分析。经贸商旅活动的感染风险一般认为是前者。
ATE和ATT一般不会一致。其主要原因是处置群和对照群的人群之间,具有某种性质的不同。如果经贸商旅活动的ATT比ATE大的话,实际经贸商旅活动的人群是相对高风险的人群。相反的话,相对低风险的人选择了经贸商旅活动,或者ATT和ATE之间没有显著的差别的话,经贸商旅活动相对安全了。
(五)子样本的设计
在本研究中,除了使用问卷调查的全部样本进行分析之外,还根据属性进行子样本划分分析。具体使用以下属性的子样本。
首先,用不同年代的子样本进行IPW的ATE推算和PSM的ATT推算。使用10、20、30岁的“年轻一代”、40、50岁的“中年一代”、60、70岁的“老年一代”的各子样本。在经贸商旅活动中,因为预计不同年代的消费方式会有很大的不同,所以计算各个年代经贸商旅活动的平均处置数值是很重要的。 其次,用性别的子样本进行IPW的ATE推算和PSM的ATT推算。目前虽然有很多男性确诊为新型冠状病毒感染者的报告,通过经贸商旅活动来确诊感染扩大是否也能维持这种趋势性的可能?所以研究又设计了感染扩大地区的居民和非扩大地区的居民之间的子样本。经贸商旅活动是伴随着人的移动,感染者从感染扩大地区流入非扩大地区(包括无症状者),或者从非扩大地区到感染扩大地区经贸商旅活动,从而引发感染,为了防止病毒扩散又带回到扩大地区使感染扩大化,因此对各个地区的经贸商旅活动者出发前所面临的感染风险也要进行一定的评价。最后根据样本中每个人的私人沟通频率进行了划分,具体使用了以下问题:比如一周一次以上、与工作以外的熟人、亲属、朋友等直接见面构成一个子样本。
三、计算结果与分析
本节表示IPW的ATE推算和PSM的ATT推算的数值。
(一)ATE推算
首先,从逆概率加权估计的平均处置数值对ATE的推算数值表示。这里所示的数值是整个样本的平均处置数值,这显示了如果作为调查对象的样本内的所有人都去经贸商旅活动的话,平均会提升多少效果。
1.对全体样本的分析(ATE)。全体样本中新型冠状病毒感染及感染症状出现(新型冠状病毒感染经历、37.5度以上的发热、严重咳嗽、喉咙痛、强烈的无力)经贸商旅活动的平均处置数值推算数值表示可信区间达到95%,经贸商旅活动可以达到5%的显著差别的平均处置数值。
根据推算,经贸商旅活动对于新冠疫情感染经历有1%左右的平均处置数值。其他样本大体上确诊了具有正确的平均处置数值,但是在“严重的咳嗽”和“腹泻”方面没有发现明显的差别。
2.根据不同年龄段的样本进行分析(ATE)。显示了将推算作为不同年代的子样本的数值。首先通过年轻一代(十岁到三十岁)的推算数值表明,经贸商旅活动的平均处置数值非常高。有新冠疫情感染经历数值是1.7%,高于所有样本1.0%的平均值。
在中年一代(四十多岁到五十多岁)的样本中,得出了以下数值,首先与年轻一代相比,对所有有效果的平均处置数值较低。有新冠疫情感染经历也只占1%,与整体水平相比没有变化。
在老年一代(60岁到70岁)的样本中,得出了以下数值,首先,有新冠疫情感染经历,其平均处置数值降低到0.3%。另外整体数值量较小。
3.性別样本分析(ATE)。男性数值量非常高的项目很多,除了咳嗽和腹泻没有显著意义外,其它对新冠疫情感染的平均处置数值是1.8%,数值比较高。与男性相比,女性数值明显较小,而且效果不明显(发热、咳嗽、倦怠感不明显)。有新冠疫情感染是0.4%,这个是男性的1.8%的2/9左右的大小。
4.感染扩大地区、非扩大地区的分析(ATE)。这里表示样本回答者回答是否居住在感染扩大地区。这里的感染扩大地区需要注意大部分都是大都市圈,确诊感染扩大地区的新冠疫情感染平均处置数值高达1.4%。与感染扩大地区的数值相比,非感染扩大地区整体数值小,而且发热、喉咙疼痛、味觉嗅觉障碍、腹泻等方面也消失了。平均处置数值为0.4%,大小在感染扩大区的1/3以下。
5.根据交流频率的分析(ATE)。IPW的ATT推算的最后,用以调查对象的交流频度划分样本时的子样本进行。具体来说,一周一次以上,通过与工作以外的熟人、亲属、朋友等直接见面组成样本,分别进行分析。首先是每周进行一次以上交流的人群。整体显示出较高的数值和有效性,特别是有过新型冠状病毒感染经历,平均处置数值为2.1%,是目前为止最高的水平。[7]
(二)趋势值匹配
根据对趋势值匹配推算来说,用平均处置数值ATT的推算数值来表示。这里所示的数值是经贸商旅活动人的平均处置数值,调查对象的样本是实际从事经贸商旅活动的人与没有出去从事经贸商旅活动进行比对,表示平均处置数值的可信度。
1.对全体样本分析(ATT)。样本全体使用新型冠状病毒感染及感染症状出现(新型冠状病毒感染经历、37.5度以上的发热、严重咳嗽、喉咙痛、强烈无力、呼吸困难、味觉障碍、腹泻),共8个症状。根据推算,有经贸商旅活动新型冠状病毒感染经历的ATT为1.3%,大于ATE的1%。
2.根据不同年龄段的样本进行分析(ATT)。结果显示ATT对不同年龄段的子样本的推算数值。首先对年轻一代(十岁到三十岁)推算数值。年轻一代的ATT非常高。有新冠疫情感染经历达到2.7%。中年一代(四十多岁到五十多岁)的样本中,果然和年轻一代相比,ATT在所有效果方面都比较低,新冠疫情感染数值是0.9%,这与ATE的1%基本相同。在老年一代(60多岁到70多岁)的样本中,所有有效性数值都很小,由此可以推测出老年一代风险相对较小,是因为他们有选择性地去参加经贸商旅活动。
3.性别样本分析(ATT)。对性别样本的推算数值。首先是关于男性对新冠疫情感染的ATT高达2.3%,超过ATE的1.8%。接下来确诊限定于女性的样本分析数值。与男性相比数值明显较小,除了新冠疫情感染数值以外,其他所有的数值都不显著,其新冠疫情感染ATT为0.8%,这是男性的2.3%的1/3左右的大小。
4.感染扩大地区、非扩大地区的分析(ATT)。首先,确诊感染扩大地区的数值和ATE一样,整体数值很高。有新冠疫情感染经历的平均处置数值是1.8%,比ATE的1.4%高一些。接下来,确诊非感染扩大地区的数值。与感染扩大地区的数值相比,整体数值小,对新冠疫情感染ATT为0.7%,较ATE的0.4%稍高。
5.交流频率分析(ATT)。在PSM的ATT推测的最后,以调查对象的交流频率(一周一次以上,是否与工作以外的熟人、亲属、朋友等直接见面)划分样本的子样本进行推算。整体显示出较高的数值有效性,特别是有新型冠状病毒感染经历的ATT为3%,高于ATE的2.1%,是本研究中最高的水平。[8] 四、总结与对策
(一)总结
根据本研究的推算数值可以看到:第一,经贸商旅活动感染风险高的是年轻人、男性、住在感染扩大地区、与朋友熟人直接接触的人。相反,对于老年一代、女性、非感染地區居住、自觉控制与熟人直接接触的人来说,相对低风险;第二,对参加经贸商旅活动有新冠疫情感染的ATT推算值与ATE推算值进行比较,ATT推算值整体较高,这表明实际选择经贸商旅活动的人在整个样本中可能是相对风险较高的人。但是其中老年人和平时就控制和熟人直接接触的人来说,ATE和ATT有很大的区别,或者ATT比较小,符合相对风险较低的选择性从事经贸商旅活动的趋势。第三,老年人感染风险低是因为目前基本退休在家,平日能够避开人群比较集聚的经贸商旅活动,如果在消费券补助发放中附加错峰出行的条件话,有可能更加安全。[9]
(二)对策
1.错峰和距离。通过禁止外出、限制移动等社会隔离政策对抑制感染症暂时有效,但对整个社会经济活动会产生巨大负面影响,今后研究“健康与发展之间的平衡”迫在眉睫。很多国家对新冠疫情政策效果进行事后评价和实证研究也确认了至少在短期内也存在这种关系。也就是说在新冠疫情结束之前,必须在抑制感染与社会经济活动平衡中进行选择。[10]比如,如果以淡季的住宿旅行为对象的话,通过扩大与繁忙期的价格差来促进不同时期的错峰消费,有助于住宿业和运输业的需求平均化。同时需求分散也有抑制设施内和移动过程中的人流密集,降低感染风险。避免职场和上下班的密集成为了一个现实问题。错峰上班和在家远 程办公是一个有效的方法,如果利用一半左右的带薪休假来分散休息日的话,也有抑制职场密集度的作用。在错峰上班增加的情况下,也提倡错峰休假和错峰旅行。
2.科学开放数据。在防止新型冠状病毒的感染扩大方面,科学数据也能发挥重要作用。第一,建立公开的关于“新型冠状病毒预防感染网站”。网站相关信息一目了然地可视化。第二,在各自展示数据的同时,民众可对各种感染状况进行讨论,为相关机构及时提供信息;第三,基于公开的数据,可以对其进行计量分析,并及时实时公布各个属性的风险指数,以便指导人们活动方向。
3.心理调整与“口罩”指数。很多人认为“由于发生疫情原因,人们担心外出安全,导致对服务业的需求下降”,但是最近的一些研究否定了这一观点。东京大学教授渡边认为:在心理学的实验中,恐惧心理的强弱和感染对策的行动(抑制外出或戴口罩等)之间有很强的相互关系,被称为影响需求的“外出戴口罩”因素。戴口罩可以预防感染,但是也影响人们外出行为的心理。如果在计算感染风险指数中,抽出一部分相关样本数据,适时公布预防感染戴口罩安全指数,指导人们在不同时间、场合、地点戴口罩的合理性,可大大缓解人们的心理压力。比起抗击疫情的“效率”价值,提高“安全、安心”的价值才是战胜“心理恐惧”的最佳方案。
参考文献:
[1]Miyawaki, A., et al., Association between Participation in Government Subsidy Program for Domestic Travel and Symptoms Indicative of COVID-19 Infection. [R] medRxiv, 2020: p. 2020.12.03.20243352.
[2]Mansournia, M.A., et al.,Separation in Logistic Regression: Causes, Consequences, and Control.
[J]American Journal of Epidemiology, 2017. 187(4): p. 864-870.
[3]Allison, P.D. Convergence failures in logistic regression. [C]in SAS Global Forum. 2008.
[4]Firth, D., Bias Reduction of Maximum Likelihood Estimates. [J] Biometrika, 1993. 80(1): p. 27-38.
[5]Greenland, S., M.A. Mansournia, andD.G. Altman, Sparse data bias: a problem hiding in plain sight. [M] BMJ, 2016. 352: p.
[6]Coveney, J., FIRTHLOGIT: Stata module to calculate bias reduction in logistic regression. [C] 2015. [7]Pierce, M., et al., Says who? The significance of sampling in mental health surveys during COVID-19. [J] The Lancet Psychiatry, 2020. 7(7): p. 567-568.
[8]Chauvenet, A., et al., Panel sampling in health research. [J] The Lancet Psychiatry, 2020. 7(10): p. 840-841.
[9]Dominik Johannes, L., Too Fast, too Straight, too Weird: Non-Reactive Indicators for Meaningless Data in Internet Surveys. [J] Survey Research Methods, 2019. 13(3).
[10][ZK(]Morikawa, Masayuki "Demand Fluctuations and Productivity of Service Industries." [N] Economics Letters,2012. 117(1), pp. 256-258.
〔本文系文化和旅游部2019年“‘雙师型’人才培养项目”(项目编号:WLRCS2019-070)研究成果〕
〔金浏河,温州职业技术学院。陈贤敏(通讯作者),浙江工贸职业技术学院〕