面向临床随访型不规则纵向数据建模的关键技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:ZGGILOVE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对临床随访型不规则纵向数据建模中的关键问题,以晚期非小细胞肺癌患者术后肿瘤进展为研究背景,以提高纵向数据建模预测性能、丰富纵向数据建模理论为目标,在调研国内外该领域文献的基础上,对临床随访型不规则纵向数据建模中的关键技术进行了系统的、深入的研究。结合统计建模和机器学习理论,研究随访型不规则纵向数据下的相似性度量、数据样本分类、肿瘤进展建模及参数估计、模型误差修正方法。可见,本研究对于丰富纵向数据建模理论具有一定的意义。利用本研究的理论成果开发的肿瘤诊疗辅助原型系统,可对临床医生进行肿瘤诊疗提供辅助决策支持,进而能通过调控关键指标而减缓肿瘤进展,延长肿瘤患者生命。因此,本研究具有重要的应用价值与现实意义。主要研究成果和贡献如下:  (1)基于EFros距离的纵向数据相似性度量方法分析了临床随访型不规则纵向数据不确定性、含缺失特征。a)在研究时序相似性度量的基础上,提出一种基于动态时间弯曲距离度量的数据集随机缺失值填充方法;b)针对不规则纵向数据不等长、不等间隔特征,提出基于PSTD距离的短时序度量方法;c)针对纵向数据的多维、非线性特征,提出基于扩展范式距离(EFros)的相性度量方法。在数据集特征提取的基础上,运用粗糙集属性约简,使变量维数与观测次数相同,从而构建特征矩阵比较两纵向数据项的相似性。仿真实验证明了对纵向数据样本进行基于EFros距离的相似性比较的可行性;又用基于EFros距离的FCM模糊聚类方法,对所提出的相似性度量方法进行评价。  (2)基于多层PSO优化的纵向数据样本多分类方法针对临床随访型不规则纵向数据分类问题,在特征选择及变量约简的基础上,提出了基于多层微粒群(MPSO)优化下的支持向量机(SVM)分类模型。a)分析了标准PSO算法会陷入局部最优的不足,提出改进的多层PSO结构,对比实验证明了所提方法能获得全局最优解,比其它方法收敛速度快;b)针对常规SVM仅支持二分类的情况,改进RBF核函数中的距离度量方法,提出一种MPSO-SVM分类模型,以适于纵向数据样本多分类的情况。对比其它分类方法,证明提出的分类方法具有更高的分类准确率。  (3)基于半参数模型的纵向数据建模方法a)针对肿瘤整体进展或大小变化,采用基于混合效应模型的建模方法;b)针对个体肿瘤大小变化,采用半参数变系数模型进行建模;并提出了基于B-样条和惩罚最小二乘的两阶段估计方法(BPLS)。推导了调整参数的选择过程,对比BSCAD方法,证明了BPLS能在估计模型系数的同时,把较小的估计系数压缩为0,实现变量筛选的目的;c)针对个体肿瘤是否进展,采用基于Logistic半参数模型的建模预测方法,提出基于广义估计方程的二次紧缩参数估计方法(PWLSE)。它可在参数估计的同时,实现对多维变量的选择,对比PGEE方法,证明了所提出的PWLSE方法的可行性、稳健性。实验证明,所提出的建模方法具有更高的预测精度。  (4)基于RBFN-HMM模型的误差修正方法针对预测模型误差问题,提出基于RBFN-HMM的误差修正方法。a)分析了RBFN网络和HMM模型的结构和参数选择过程,用RBFN网络对肿瘤大小序列进行建模,并采用尝试法和梯度下降法设置RBFN网络结构和参数,构建肿瘤预测模型。该模型用径向基(RBFN)神经网络来逼近肿瘤序列中的非线性部分;b)用隐马尔可夫模型(HMM)对肿瘤预测中的误差序列进行建模,通过蒙特卡罗SMC方法实现RBFN-HMM模型结构和参数的在线调整。最终用于肿瘤大小预测模型的误差修正,提高模型预测精度。  (5)设计了肿瘤诊疗辅助原型系统分析了基于非小细胞肺癌(NSCLC)诊疗系统的功能需求,设计了系统的总体框架,用所提出的理论方法实现了肿瘤辅助诊疗原型系统,并将该原型系统成功应用于非小细胞肺癌的在线诊疗平台。从而验证了所提出的理论方法的有效性,体现了本研究的应用价值。同时对原型系统的可用性进行了评估,将所取得的理论成果成功应用在实际诊疗应用中,是对不同领域知识融合应用研究的一次有益探索。  
其他文献
学位
学位
学位
随着人们对水资源需求量的不断增加,采取有效措施防止地下水污染和过度开采、保护地下水的重要性逐渐引起人们的日益重视,合理开采和利用地下水资源已成为一项亟待解决的重大问
学位
学位
学位
在实际工程测量与真实战场的操作中,系统的评测软件的可视化界面的生动性和真实性仍存在不足。更精确、更生动、更具实用性地满足工程测量以及军事应用已成为定位定向系统的一
学位
学位