基于机器学习分类算法的前列腺癌和前列腺增生预测模型研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:gui_123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
前列腺癌的早期检测方法主要是通过前列腺特异性抗原检测,但由于前列腺特异性抗原的血清水平会受到前列腺增生和前列腺组织严重炎症的影响,使前列腺癌早期诊断假阳性增高,导致患者进行非必要前列腺穿刺活检的概率增加。因此,本文基于前列腺癌和前列腺增生患者的临床数据,通过机器学习进行特征选择方法的筛选,并构建前列腺癌和前列腺增生预测模型,为临床医生的决策提供一定的依据。前列腺癌和前列腺增生预测模型主要工作如下:首先,整理2 472例患者临床数据,增加数据探索环节,完善数据预处理流程,对数据进行缺失值填充、异常值处理、数据变换、数据规约,完成数据预处理工作。选取11种特征选择方法,生成11个特征子集,并提出了基于最小二乘法的线性回归模型筛选特征子集的方法,共筛选出卡方检验、极度随机树、随机森林这3种特征选择方法,并生成相应的特征子集。其次,将3个特征子集分别输入到单分类预测模型(逻辑回归、决策树和支持向量机)和集成学习预测模型(随机森林、自适应增强和极端梯度提升)中进行综合比较,并用多种评估指标对模型的预测性能进行评估。对前列腺癌和前列腺增生预测模型进行评估结果发现:极度随机树特征子集能够较大的提升逻辑回归模型的预测性能,随机森林特征子集能够较大的提升支持向量机模型在前列腺癌方面的的预测精度,但从预测模型整体预测性能方面考虑,集成学习算法构建的预测模型占优势。最后,基于特征子集与预测模型相互组合得到的6组模型预测结果,筛选出最优的前列腺癌和前列腺增生预测模型。预测模型评估结果表明,最优的前列腺癌预测模型为基于卡方特征子集的自适应增强模型,最优的前列腺增生预测模型为基于极度随机树特征子集的自适应增强模型。结合得到的最优模型设计了一个前列腺癌和前列腺增生的癌前周期管理机制,为前列腺癌和前列腺增生预测模型的应用提供参考。
其他文献
2015年,中国科技部和欧盟科研与创新总司共同设立了中欧联合资助计划,以支持各自的科学家开展联合研究。学界对该计划的评估和研究相对较少,鉴于此,基于“十三五”中欧联合资助计划绩效评估的展开,通过综合的评估方法,对联合资助计划的目标定位、资助现状、资助成效和管理现状进行评估,以期为中外联合资助计划和合作计划的评估,以及未来中欧科技合作的布局和发展提供参考。评估结果显示,中欧联合资助计划具有多边合作优
期刊
认知灵活性允许个体在变化的环境中快速调整行为反应,但存在较大的个体差异——认知灵活性较低的个体在多变的环境中更可能表现出适应不良的问题。本课题考察在急性社会应激的影响下,个体在趋近-回避威胁刺激的规则的反复逆转过程中,灵活学习新规则的能力是否受到负面影响,并进一步探究了催产素对这种应激相关的认知灵活性下降的干预作用。本课题包括两项实验室研究:研究一招募了男性和女性大学生被试各50名,使用特里尔社会
学位
癫痫是一种常见的神经系统疾病,其特征包括意识的丧失以及运动、感觉或其他认知功能的紊乱。由于发作具有不确定性,癫痫不仅会对患者造成身体和心理伤害,还会对社会产生一定影响,及时且有效地预测癫痫发作对患者个人和社会都具有重要意义。目前已经存在多种基于EEG特征的癫痫发作预测方法,但其性能仍有提升空间。该文将脑电信号的时频特征与深度学习相结合,实现了发作预测性能的进一步提高。首先,分别对正常状态和癫痫发作
学位
网络给我们带来生活、工作的便捷之余,也同样带来了数据泄露、账户信息被窃取等各种安全隐患。随着网络的不断更新迭代,网络安全形势也愈发纷繁复杂,网络入侵检测作为防护网络安全的一种重要手段,近些年来也一直被广泛关注,然而,为复杂和高维数据开发有效的网络入侵检测方法仍然是一个挑战。首先,对结合了压缩网络和生成式模型的网络入侵检测算法深度自编码高斯混合模型(Deep Autoencoding Gaussia
学位
以2012-2020年中国A股上市公司为研究样本,基于中央经济工作会议精神文本与上市公司“管理层讨论与分析”文本构建经济政策关联度指标,并研究其与投资效率的关系。研究发现,经济政策关联度越高,投资效率越高。同时,采用主成分分析法构建公司治理水平的综合指标,研究发现当公司治理水平越高时,经济政策关联度与投资效率之间的正向关系更为显著。此外,进一步研究发现经济政策关联度影响投资效率的渠道主要是政策支持
期刊
随着时代的发展,信息安全被更多人所关注。为保护用户隐私,越来越多的技术采用基于生物特征的验证方法来判断登录者是否为合法用户。在诸多特征选择中,语音因其信息丰富、获取方便等优点具有潜在优势。然而基于语音的验证方法有一定的局限性,如某些说话不便的场所使用语音验证会打扰他人、嘈杂环境下语音质量变差导致验证性能严重下降等。因此,如何拓展说话人验证系统的应用范围、提高噪声环境下语音的质量成为研究关键。为解决
学位
随着Web程序的广泛应用,SQL注入漏洞严重威胁它们的安全运行。二阶SQL注入由于其隐蔽性和阶段触发的特性,目前相关的研究可分为基于隐式融合和基于显式数据源标识的二阶SQL注入漏洞检测防御方法。基于隐式融合的方法无法有效的识别当前注入漏洞是由存储的攻击负载触发,而基于基于显式数据源标识的方法也存在检测类型有限和检测误报率高的缺点。因此本文提出了一种基于静态分析和动态执行的二阶SQL注入漏洞安全分析
学位
行人再识别技术作为智能视频监控网络中的一个重要环节,其目的是通过给出一幅行人图像,在若干个不重叠的摄像头之间找到匹配的行人图像,从而在大规模数据库中快速有效地检索和跟踪特定的行人。该文利用深度学习技术,从如何提取辨别性的特征和跨域的行人再识别上展开研究。首先,针对跨域行人再识别导致的准确率下降问题,构造了迁移互累积学习网络结合Jaccard距离序优化的行人再识别算法。在目标域上利用聚类算法生成硬伪
学位
关于古元延安木刻的风格"转变"问题,研究界多强调1942年延安文艺座谈会的影响及艺术家对群众观点、民间形式的采纳。在这类断裂叙事之外,更值得探究的是古元在这一"转变"背后未曾中断的形式机制,及其在新内容与旧形式之间细腻的、富于创造性的形式改造路径。古元的形式探索真正关切的是,如何构造出富于情感性的艺术"细节"与有条件的"真实",从根本上贴近农民的生活经验、情理结构与身心感觉。但从1945年关于新年
期刊
光学频率合成器可将某一特定波段的参考光(比如光钟信号)的频率特性以设定的频率比值、高保真地传递到其他所需波段,在光钟应用、精密光谱与测量等科学与技术领域扮演着日趋重要的角色。实现光学频率合成器的自动化控制是光学频率合成器走向实用化的关键。本文面向光学频率合成器的自动化控制,针对该系统中参考激光、输出激光的频率自动化控制进行研究。采用单片机作为逻辑控制元件对模拟伺服电路进行控制,从而实现参考激光的频
学位