基于大规模结构化病例数据的新型冠状病毒传播特

来源 :中国科学(信息科学) | 被引量 : 0次 | 上传用户:hxs038
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2020年年初,新型冠状病毒感染的肺炎(COVID-19)爆发,中国采取了全面严格的防控举措全力抗击疫情.地方疫情指挥部门及时通报疫情感染数据,有助公众了解疫情的发展,及时做好防护措施.各地患者病例详情数据主要以文本形式记录,信息描述复杂,且各省市汇报的格式各异,处理难度较大.我们面向全国湖北省外近二分之一匿名的患者病例详情数据,提出了应用自然语言处理技术,辅助病例数据结构化的方法.该方法可以在标记样本较少的情况下,借助预训练模型,准确有效地提取出病例文本中的关键信息.通过对较大规模患者结构化病例数据的挖掘,本文详细分析了新型冠状肺炎总体发病性别和年龄分布特点、主要感染原因、潜伏期特点及疫情趋势等特征.由于潜伏期等时间延迟的存在,确诊人数往往不能反映一个地区的真实感染情况,结合出行大数据,本文提出了一个合理推断武汉市等城市实际感染人数的方法.该方法有助于人们提前估计地区疫情发展情况,及早采取防护措施.也可以辅助地方相关部门科学决策,尽早调度医务人员和分配医疗资源.
其他文献
软件定义网络(software defined networking, SDN)作为一种新型的网络架构,将网络的控制平面与数据转发平面分离,实现了可编程化控制,为互联网提供了改善网络全局性能的新思路.虽然SDN具有全局视角优势,但在处理互联网海量数据时也存在性能瓶颈:频繁的层间通信会使控制器计算效率下降,海量的流表项数据使得交换机存储压力过大.为了进一步提升SDN的性能使其适应互联网的海量流量处理
通过对NaC1在水溶液中的电离研究,发现“完全电离”是一种理想模型.0.01 mol·L-1 NaC1电离度为94%,超过30%,故氯化钠属于强电解质.Na+与H2O可以通过配位键形成水合钠离子,其中
本文通过分析当前农村初中数学教学存在的问题和导致教学质量低下的原因,而相应对策采取培养学习兴趣,促进学生思维能力的发展,促进教学质量的稳步提高.
九年级化学一至六单元新课教学完成后可设计专题小结课,引导学生通过宏观、微观、符号、量、实验及曲线等视角学习和研究物质,将六个单元中的知识结构化、系统化,建立知识之
Apopular saying goes,“Seventy-twoof the 108 outlaws of the marsh arefrom Yuncheng.”Located inShandong Province with Liangshan Hill onits east,the Huanghe Riv
主题出版与集体记忆密切相关,二者具有高度的内容重叠性与同向的目的性,加强主题出版工作必然要思考如何形成以及形成何种全社会一致性的集体记忆,集体记忆对主题出版在内容
本府根据五月十七日第一次省府全体委员会决定,并於七月十九日经省府政务会议通过,决定八月中旬在南昌召开全省首届各界人民代表会议,现将代表资格、名额、分配及代表产生办