生物医学大数据:现状与展望

来源 :中华流行病学杂志 | 被引量 : 0次 | 上传用户:wuwu245
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

大数据(big data)是指由于容量太大和过于复杂,无法在一定时间内用常规软件对其内容进行抓取、管理、存储、检索、共享、传输和分析的数据集。大数据具有“4V”特征:①数据容量(Volume)大,常常在 PB(1 PB=250 B)级以上;②数据种类(Variety)多,常常具有不同的数据类型(结构化、半结构化和非结构化)和数据来源;③产生和更新速度(Velocity)快(如实时数据流),时效性要求高;④科学价值(Value)大,尽管利用密度低,却常常蕴藏着新知识或具有重要预测价值[1]。人类已进入大数据时代。国际数据公司的研究结果表明,2011年全球产生的数据量高达1.82 ZB[2]。2012年5月,联合国发布了《大数据与人类发展:挑战与机遇》白皮书,指出大数据是一个历史性机遇,人们可以使用极为丰富的数据资源对社会经济进行前所未有的实时分析,帮助政府更好地响应社会和经济运行[3]。

其他文献
目的 评估新近确诊感染HIV的MSM人群在确诊前后的性行为变化。方法在成都和天津,对新近确诊感染HIV的MSM人群进行回顾性调查,收集调查对象确诊前和确诊后6个月的性行为信息。对确诊前后6个月内的性行为进行比较(McNemarχ2检验),对确诊后6个月内的高危行为的影响因素进行logistic回归分析。结果共调查129名新近确诊的HIV感染者或患者,平均年龄为31.8岁,主要通过互联网寻找性伴。调
目的 探讨血尿酸(SUA)水平对男性人群全因死亡的影响。方法采取前瞻性队列研究方法,以2006-2007年度参加开滦集团健康体检的81110名男性职工为研究对象,排除既往有心肌梗死、脑卒中、恶性肿瘤病史及肾小球滤过率(eGFR)<30 ml/(min·1.73 m2)、服用对SUA有影响的药物者;进行统一问卷调查、血液生化检查,平均随访(47.5±4.3)个月,依据2006-2007年度SUA值将
HBV可以通过血睾屏障进入睾丸组织和精液中,可能影响精液质量,降低男性生育能力[1].近年来,接受辅助生殖技术(ART)治疗的夫妻中HBV感染及高HBV-DNA载量者并不少见,男方慢性HBV感染且血清HBV-DNA拷贝>5.0×102 IU/ml的患者接受ART治疗后是否对体外受精-胚胎移植(IVF-ET)结局有影响还不清楚.本研究对男性HBV-DNA阳性(其配偶完全排除HBV感染的可能)和阴性对
目的 明确成都市儿童青少年静态生活方式现状及其与超重/肥胖的关系,探讨预防儿童青少年超重/肥胖的可能性.方法 采用整群随机抽样方法,抽取成都市2 211名7~15岁儿童青少年测量身高、体重等,同时使用自行设计的基础问卷和体力活动问卷进行调查,了解该人群基本情况及静态生活方式.结果 采用国际肥胖特别工作组(IOTF)标准,非超重、超重和肥胖组中男生周末看电视时间≥2 h/d报告率分别为34.80%、
Markov模型是生物医学上常用的一种随机过程模型。随机过程X=﹛X(t),t∈T﹜是一组依赖于t的随机变量,即对于每一个t,Xt是一个随机变量,称为过程在t时刻的状态。Xt的所有可能取值称为过程的状态空间。当给定Xt的值时, Xt+1的概率分布只依赖于Xt的值,而与X1,X2,…,Xt-1的值无关。即将来的状态只与现在状态有关,与过去状态无关,这种特性称为Markov性[1]。Markov模型通
目的 了解我国慢性非传染性疾病(慢性病)预防控制政策能力,各级疾病预防控制中心(CDC)和基层医疗卫生机构慢性病预防控制能力现状。方法通过网络问卷调查全国省、地(市)和县(区)级3352家CDC及1200家基层医疗卫生机构。结果(1)政策能力:省、地(市)和县(区)级政府配置慢性病预防控制专项经费的比例为75.0%、19.7%和11.3%。(2)基础配置能力:7.1%的县(区)级CDC设有慢性病预
目的 研究波摩那沙门菌的耐药分子流行病学特征.方法 基于上海市网络实验室连续性监测腹泻病例和环境食品及广西地区爬行动物监测的波摩那沙门菌进行抗菌药物耐药和脉冲场凝胶电泳(PFGE)分析.结果 2005-2012年上海市网络实验室诊断临床病例分离沙门菌4 553株,居前10位的20个血清型均为A~F群,波摩那沙门菌在少见的非A~F群中仅次于旺兹沃思沙门菌排第2位,并对低年龄组人群普遍易感,症状有血样
自身病例对照设计(如病例交叉设计、自身对照病例系列研究)虽然能控制不随时间变化的混杂因素(可测量或不可测量的)的影响,但是不能控制暴露时间变化趋势所带来的混杂.双向病例交叉设计可以控制暴露时间变化趋势.但是在药物流行病学的研究中,疾病状态通常影响后续的药物使用,因此这种双向病例交叉设计往往不适用.Suissa提出的病例-时间-对照设计将病例交叉设计和病例对照设计相结合,很好地控制了暴露的时间变化趋
目的 掌握中国就业流动人口红肉摄入水平和超标率.方法 采用分层整群抽样方法,利用半定量食物频率表膳食调查法分析中国31个省(自治区、直辖市)和新疆生产建设兵团170个县(区、团)中48 511名18 ~ 59岁就业流动人口的红肉摄入情况.对数据进行复杂加权后,计算不同人口学特征的流动人口日均红肉摄入量和超标率.结果 (1)样本人群日均红肉摄入量为125.9(95%CI:116.5~ 132.5)g
目的 探讨新疆哈萨克族成年人群最适WHR切点值对筛选心血管疾病高危人群的作用.方法 2007年10月至2010年3月开展新疆地区心血管风险调查(CRS),共选择具有代表性样本14 618人,其中哈萨克族4 094人,从中选取资料完整的4 004人作为研究对象,年龄35 ~ 88岁,平均48.60岁.测量并记录每名入组对象的血压、TC、TG、LDL-C、HDL-C和FPG.计算并记录不同WHR值所对