数据挖掘与生物信息技术在肺结核不同感染状态间生物标志物筛选的应用研究

被引量 : 0次 | 上传用户:xixixi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:基于基因表达数据库中的肺结核样本数据,应用生物信息学方法筛选能同时区分肺结核患者、结核潜伏感染者和健康人群的差异表达基因,并使用数据挖掘算法加以验证,为肺结核早期明确诊断提供理论依据和有力工具。方法:对GSE19491、GSE37250、GSE42834数据集进行下载、注释等预处理,使用经验贝叶斯方法对3个数据集进行合并,去除批次效应。筛选肺结核患者、结核潜伏感染者和健康人群的差异表达基因,进行GO功能和KEGG通路富集和蛋白质相互作用网络分析。对3类人群共有的差异表达基因使用Lasso法降维和筛选,得到核心差异基因。基于核心差异基因采用十折交叉验证并重复100次训练验证模型。通过3×3混淆矩阵计算模型准确率和3类人群在模型中的精确率、召回率和F1值,综合评价模型的验证效果。结果:(1)经数据集合并处理后,合并数据集共有487个样本和19144个基因;以|log2FC|>1.5,FDR值<0.05为阈值发现肺结核患者与健康人群中共有差异表达基因787个,结核潜伏感染者与健康人群中共有差异表达基因355个,肺结核患者与结核潜伏感染者中共有差异表达基因1296个;差异表达基因主要富集于先天免疫反应、免疫反应、分泌调节免疫系统过程、防御反应、细胞激活等生物学通路;蛋白质相互作用网络丰富。(2)肺结核患者、结核潜伏感染者和健康人群的共有核心差异基因为34个,经Lasso特征选择后减少为18个;其中HRK、PNMA3基因在肺结核患者和结核潜伏感染者中呈上调表达,其余基因表达水平均在肺结核患者和结核潜伏感染者中呈下调表达;线性判别分析算法具有最高的准确率和F1值;EPSTI1、SLC26A8、GBP6等10个核心差异基因是能够区分肺结核患者、结核潜伏感染者和健康人群的潜在生物标志物。结论:生物信息学方法结合数据挖掘技术可以从分子和基因层面有助于判断肺结核的疾病进展,具有一定可行性和应用价值,为肺结核的精准诊断提供了方法和思路。
其他文献
阐述计算机网络安全中的数据加密技术特点,分析现代密码体制加密、属性基加密、链路加密、节点加密等数据加密技术,探讨数据加密技术在计算机网络安全中的应用方式。
期刊
计算机网络的覆盖以及影响范围,如今仍然在不断扩大。网络系统必须通过速度以及信息传输量的提升以满足快速信息交互的需求,但信息安全在信息网络传输中同样意义重大,尤其在依赖于信息网络的电子商务领域,信息安全更加重要。针对当前网络信息交换过程中存在的主要问题,信息安全需要通过加密算法的调整以及传输方式的控制来实现。本文对影响加密效果以及信息安全的主要因素,进行了系统的论述,供相关读者参考。
期刊
随着社会的发展、信息技术的提升、数字化浪潮而产生的大数据分析、人工智能、移动互联、云计算、物联网、区块链等新型信息技术,不断影响和彻底改变了人们的生活。在"大智移云物区"的背景下,更多的公司走向了智能化、数字化的发展道路,企业财务也因此步入到智能时代,智能财务应运而生。智能财务以数字化为基础,利用人工智能技术,并结合大数据分析对原始数据提取、数据分析,为决策过程提供了数据分析支撑,从而大大提高了财
学位
报纸
报纸
期刊
随着大数据时代的来临,以海量的公共数据资源为基础的公共数据开放作为建设服务型政府和数字化政府的关键制度,目前已突显出强大的经济效应、政治价值和社会效益,数据资源也正逐渐成为国家的战略性资源。近年来,公共数据开放已经成为全球关注的热点,相关领域内的探索进程也在多国范围内加速进行。我国政府也已意识到公共数据中潜在的深层次价值,无论是中央还是地方,都在为提升公共数据开放水平积极试点、推行。从传统意义上的
学位
网络虚拟化与信息安全技术课程教学改革的探索始终以国家政策为指引,在具体的教学过程当中注重培养学生的专业知识素养能力。本次教学改革基于学生的知识储备情况,在数据加密技术及应用部分的教学添加了编程实现的课堂编程练习,能够有效地增加学生对知识点的理解与运用,有效地提高学生的学习兴趣。本教改课程使用了讲授、提问、练习、讨论等教学方法,通过分析现状以及教改课程培养目标的定位,探索适合当代大学生、本院学生的教
期刊
<正>糖尿病和高血压均属于代谢性疾病,这两种疾病有共同的发病因素。根据医学调查显示,高血压患者常伴糖尿病,而糖尿病患者经常会出现高血压症状,在医学上高血压和糖尿病经常相伴出现的,糖尿病会加重动脉粥硬化的程度,动脉硬化是导致血压升高的主要因素。日常生活中,经常发现高血压患者会伴有糖尿病,主要是这两种疾病有共同的发病因素,如不良饮食习惯、生活习惯(高油、高糖、高盐饮食、喝酒、熬夜等),所以就会出现高血
期刊
目的 分析探究缬沙坦联合硝苯地平治疗门诊原发性高血压的疗效。方法 研究对象为2019年1月至2019年12月期间接受治疗的80例原发性高血压患者,实施随机数字表法分组处理,对照组接受缬沙坦治疗,观察组接受缬沙坦联合硝苯地平治疗,每组各40例。对比两组患者最终治疗情况。结果 治疗前两组血压数据对比不具有统计学差异(P> 0.05);经治疗后,观察组收缩压、舒张压改善成效优于对照组(P <0.05),
期刊