论文部分内容阅读
目的:采用宏观与微观结合的研究方法,了解大学生体能活动伤害(Physical Activity-Related Injury,PARI)多维度影响因素,对大学生PARI的环境、心理、社会、生物因素进行分析,开展SNP、肠道菌群和多发性PARIs的相关性研究,探讨大学生多发性PARIs发生的分子机制,寻找多发性PARIs潜在肠道菌群生物标志物,并综合多维度因素建立多层级的大学生PARI风险预测模型,为大学生PARI高危人群的早期筛查和干预提供科学依据。方法:通过德尔菲法和层级分析法构建高校体能活动环境评价指标体系,评估高校的体能活动环境状况。通过整群随机抽样方法抽取汕头、临汾两地两所高校2017-2019级大学生进行横断面调查,了解大学生PARI的发生现况。应用巢式病例对照研究,对参与横断面研究的2019级大学生进行面对面问卷调查,了解其PARI发生的相关特征以及生物、心理、环境、社会多维度影响因素,并进行为期一年的随访调查,筛选出病例组和对照组的研究对象开展1:1配对病例对照研究,检测研究对象的血液和肠道菌群生物样本。采用Mass ARRAY SNP分型实验检测血液中候选基因SNP,利用16S r DNA扩增子测序检测粪便样本的肠道菌群构成。计量资料及计数资料分别以均数和标准差((?)±S)或频数(百分比)进行统计描述。采用t检验和(?)~2检验计算组间差异。基因型和等位基因的Hardy-Weinberg平衡应用(?)~2检验。多发性PARIs与等位基因、基因型及其显性、隐性模型相关性通过Logistic回归进行分析,广义多因子降维法用于分析各因素之间的交互作用。通过α多样性分析、β多样性分析、分类学组成分析、LEf Se组间差异分析及PICRUSt菌群代谢功能预测等,寻找差异菌群及其相关的作用通路。阐明大学生SNP、肠道菌群对多发性PARIs的影响作用。结合前期调查数据,使用Lasso特征选择方法筛选变量,采用Logistic回归、支持向量机、随机森林、极限梯度提升、人工神经网络模型构建大学生PARI分层级预测模型。采用Epi Data Entry进行双录入并进行一致性检验及逻辑检错,采用SPSS23.0、Yaanp2.5、PLINK1.07、Haploview 4.0、FLASH 1.2.7、Uparse 7.0、Qiime 1.9.1、GMDR07、R 4.0.2及Python 3.7进行统计分析,检验水准为α=0.05。结果:1.高校体能活动环境评价体系主因子中,物质环境重要性最高,权重为0.466,其次校园文化环境权重为0.233,社会心理环境的权重为0.172,重要性较低的自然生态环境权重为0.129。物质环境方面以场地设施安全指标权重最高,为0.190;自然生态环境中以气候状况权重最高,为0.040;校园文化环境中以教育方式及内容指标权重最高,为0.043;社会心理环境中校园心理状态指标权重最高,为0.035。2.横断面调查显示大学生PARI发生率为22.5%(937/4161),其中21.7%为多发性PARIs。汕头地区高校大学生PARI发生率最高(29.8%,506/1698),临汾地区则为(17.5%,431/2463)。男生(26.1%,423/1622)PARI发生率高于女生(20.3%,514/2539)。汕头地区(OR=2.952)、男生(OR=1.304)和大一年级学生(OR=1.147)发生PARI可能性更大,运动代表队成员(OR=3.143)及患有慢性疾病/症状者(OR=1.541)的PARI发生率更高。睡眠不足(OR=1.418~1.425)、电子设备的使用长(OR=1.325)可提高PARI发生风险。巢式病例对照研究结果显示过去十二个月中共有388名(男生:228/640,女生:160/704)学生发生过PARI,累积发生次数为528人次(男生:302人次,女生:226人次),PARI发生风险为0.39次/人/年,男性大学生的发生PARI风险高于女性(分别为0.47次/人/年与0.32次/人/年,P<0.001)。男生、运动代表队成员发生PARI的风险更大(OR值分别为1.346、2.455),抗生素使用和酸奶的经常食用及肠易激状态也对PARI的发生产生影响(OR值分别为1.848、0.579、1.485),负向PA行为及刺激寻求行为特征者具有更高的PARI发生可能性(OR值分别为1.470、1.462)。3.BDNF基因的rs925946、OPG基因的rs4355801位点与多发性PARIs的发生具有相关性。rs925946-GG、rs4355801-GA和rs4355801-GG可降低发生多发性PARIs的风险(OR值分别为0.128、0.420和0.142)。单倍型分析得出COL5A1基因的rs10858286、rs12722、rs3128575这3个位点所组成的单倍型中,T-T-C多发性PARIs发生的风险较高(OR=2.064,P=0.017)。COL5A1基因的rs12722与COMT基因的rs4818存在交互作用,当rs4818位点的基因型为TC与rs12722位点的基因型为CC时,具有较高的多发性PARIs发生风险(OR=7.500,P=0.049)。运动代表队成员、负向PA行为与不同的基因位点存在交互作用,影响多发性PARIs发生。4.多发性PARIs组和健康对照组两组间在肠道菌群物种丰富度和多样性无显著性差异,在物种结构和组成均存在差异,且组间差异大于组内差异(R=0.025,P=0.024)。在门水平上,与健康对照组相比,PARIs组的拟杆菌门显著富集(35.0%vs 25.7%,P<0.05),而变形菌门在健康对照组中富集(30.4%vs 20.4%,P<0.05)。在属水平上,最优势菌属大肠埃希菌志贺菌、假单胞菌属、巨单胞菌属、柠檬酸菌属、丛毛单胞菌属在健康对照大学生的粪便中富集;拟杆菌属、普雷沃氏菌属、双歧杆菌属、普雷沃氏菌属、粪杆菌属在多发性PARIs组大学生的粪便中富集。LEf Se分析结果显示PARIs组的拟杆菌门的相对丰度显著高于健康对照组;拟杆菌属和副拟杆菌在PARIs组的丰度明显升高,而巨单胞菌属在健康对照组的丰度明显升高。5.基于PA信息的大学生PARI预测模型构建中,五个模型预测准确率相差不大,LR模型的AUC(0.670)高于SVM和DNN,与RF和XGBoost相比不具有统计学差异。但LR模型的灵敏度(0.628)相对最优。基于PA和心理行为信息的预测模型构建中,综合四个模型的灵敏度和阳性预测值,LR模型表现最为均衡,LR模型(0.67)被选为最佳模型。基于多维度信息的预测模型构建中,DNN模型的准确率最高(0.711),但该模型的灵敏度和阳性预测值相对最低,XGBoost模型的AUC(0.679)、灵敏度(0.846)最高,选择XGBoost模型作为最佳模型。个性化预测模型中,随机森林模型表现出良好的预测性能。根据筛查环境采用不同层级的预测模型可以提高大学生PARI发生风险预测效率,从而早期有效识别PARI高危人群,为及时制定有效的预防措施提供科学依据。结论:1.构建了包含4个一级指标和27个二级指标的高校体能活动环境评价体系,主要包含物质环境、自然生态环境、校园文化、社会心理环境四个层面,可用于评估高校体能活动环境安全等级并计算总体得分及各级指标的得分,定量化地査找高校体能活动环境中存在的薄弱环节。2.大学生群体的PARI发生率较高,受生物、心理、社会、环境多维度因素的影响,应采取针对性多方位的有效干预策略减少PARI的发生。3.BDNF基因的rs925946和OPG基因的rs4355801可影响多发性PARIs的发生风险,基因与基因、基因与环境的交互作用可影响多发性PARIs的发生。4.研究结果显示PARIs组大学生的肠道菌群组成与健康对照组存在差异。拟杆菌属和副拟杆菌丰度升高、巨单胞菌属丰度降低可能是PARIs的标志性菌群特征。5.基于机器学习构建的大学生PARI预测模型具有一定的预测能力,基于PA信息和基于PA、心理行为信息预测模型中Logistic回归预测模型对大学生PARI发生的预测效果较好,基于多维度信息的预测模型XGBoost模型对大学生PARI发生的预测效果较好,个性化预测模型中随机森林模型表现出良好的预测性能。