大型队列研究中的数据科学

来源 :中华流行病学杂志 | 被引量 : 0次 | 上传用户:zs001444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

大型队列研究作为生物医学研究的宝贵资源,在揭示疾病的病因、发病机制,改善疾病预后,减轻疾病负担等方面显示了巨大的作用。数据科学是一门新型的交叉学科,它采用计算机科学和统计学方法与特定专业领域相结合,发现数据背后的规律和知识。两者的结合为我国疾病防治策略和措施的制定提供新的证据。本文介绍了数据科学的基本概念,并结合大型队列研究的特点和发展趋势,分析队列研究数据的内容和结构特点,探讨了数据科学在大型人群队列的不同研究阶段的应用和价值,以及数据科学在大型队列研究中的应用前景。

其他文献
目的描述中国不同地区群体遗传结构特征,探索并评价不同分析方案控制队列样本群体遗传结构混杂因素的效果。方法通过中国慢性病前瞻性研究(CKB)队列10个地区4 500例样本的全基因组关联研究数据,通过主成分分析提取样本第一、二主成分,绘制主成分二维图,并与样本地区来源相比较,分析我国不同地区样本的遗传结构特征。以CKB队列数据为基础,生成存在遗传结构差异、亲缘关系等队列样本特征的模拟数据集,探索并评价
本文旨在对医学期刊统计报告要求中的条目进行详述与解读,为提高医学论文的统计报告质量提供参考。本文基于国际医学期刊编辑委员会(ICMJE)、提高健康研究质量与透明度协作网(EQUATOR)、中华医学杂志编辑部等发布的医学研究报告规范,从研究设计、统计分析与结果报告3个方面对统计学相关条目进行归纳,并结合已发表的医学论文进行案例解读。需要注意的是,英文医学期刊普遍参考ICMJE提出的"医学期刊学术著作
目的探讨中国31个城市夏季高温变化与人群死亡之间的关联性。方法收集中国31个城市2008年1月1日至2013年12月31日的每日死亡数据和气象数据。运用分布滞后非线性模型,控制长期趋势、"星期几效应"等的影响,分析夏季前期和后期高温变化与死亡的相关性。结果夏季前期高温对死亡影响的RR值高于后期,夏季前期高温对死亡影响的RR值集中于1.08~2.14,夏季后期高温对死亡影响的RR值集中于1.03~1
目的估计2013年10月至2016年9月湖南省安化县各血清型及分年龄组的手足口病住院负担。方法收集6家病毒学监测医院的儿童手足口病住院记录及23家乡镇卫生院的手足口病新农合报销记录,估计安化县分年龄组的手足口病住院负担。结合病毒学监测结果,估计各血清型肠道病毒(EV)相关的手足口病住院负担。结果共纳入手足口病住院病例3 541例,其中实验室确诊病例数为3 146例。仅有1例为手足口病重症,其余均无
目的分析河南省HIV感染长期不进展者(LTNP)病程进展及人类白细胞抗原(HLA)基因多态性特征。方法采用回顾性研究,对河南省2011-2016年检测及随访信息完整的48例LTNP进行分析,探讨随访期间CD4+T淋巴细胞计数(CD4)、病毒载量(VL)的变化情况。采用聚合酶链式反应-序列特异性寡核苷酸探针技术(PCR-SSOP)对LTNP及健康对照的HLA-A、HLA-B和HLA-DRB1基因位点
目的分析1990-2016年中国高BMI导致的糖尿病疾病负担。方法应用2016年全球疾病负担研究结果,分析1990-2016年中国各省份与高BMI具有病因学联系糖尿病的死亡资料以及疾病负担[包括伤残损失寿命年(YLD)、过早死亡损失寿命年(YLL)、伤残调整寿命年(DALY)],以2010-2035年世界平均人口结构为标准,对死亡率进行标化,比较1990和2016年中国高BMI导致糖尿病死亡的变化
目的了解全球札如病毒(SaV)急性胃肠炎暴发的流行病学及病原学特征。方法通过万方、中国知网、PubMed、Web of Science等数据库,检索2018年1月以前发表的SaV急性胃肠炎暴发文献,对文献进行评价和筛选,分析暴发的时间分布、地区分布、场所分布、人群分布、传播途径、病原学特征、患者临床症状等。结果共收集到34篇SaV暴发文献,涉及146起暴发,发生时间范围为1976年10月至2016
目的了解山东省抗病毒治疗HIV/AIDS的生存状况及影响因素。方法运用Kaplan-Meier(K-M)法及累积发生函数(CIF)估算2003-2015年山东省抗病毒治疗HIV/AIDS的艾滋病相关死亡发生率、部分分布比例风险回归模型(F-G模型)分析生存状况及影响因素。结果竞争风险存在时,K-M法计算艾滋病相关死亡累积发生率高于CIF。CIF估算5 593例治疗HIV/AIDS随访1、3、5、1
目的探讨5类高发慢性病及慢性病患病数目对老年人日常活动能力(ADL)的影响。方法将2002年中国老年健康影响因素跟踪调查访问的10 501名老年人的调查信息作为基线数据,随访该队列人群至2014年,采用Cox比例风险模型分析5类高发慢性病及慢性病患病数目对不同年龄组老年人ADL的影响。结果与不患任何慢性疾病的老年人比较,患高血压可增加各个年龄组老年人的ADL受损风险,65~74岁组增加43%(HR
母婴队列在母婴健康相关研究中有着不可替代的地位。相比国外,中国的母婴队列研究起步晚,有着其独特的发展轨迹。本文对中国近25年来建立的覆盖范围较广、影响力较大的母婴队列的基本情况及特点进行综述。