论文部分内容阅读
在长期与疾病的斗争中,中医演化并形成了一套独特且完整的理论体系,为中国及世界人民的健康做出了不可磨灭的贡献,在诸如慢性乙型肝炎的个体化治疗中显示出特有的优势,以至于越来越受到各国人民的欢迎,以及引起许多研究者的重视。但是传统中医诊断学的经验性、不确定性、模糊性等特点,严重制约了中医的发展和应用。中医证的研究一直是中医现代化研究的关键之一,也是中医用药和治疗的重要依据,其核心是证候分类和诊断标准的研究,然而目前的中医辨证过程缺少严格设计的统一框架,和规范化、定量化的诊断标准,如何将经验且模糊的中医辨证过程规范化、客观化和具有可计算性是本文研究的主要问题。本文旨在运用智能技术从中医和西医两个角度对中医证候进行综合性研究,引入混合智能系统理论,为中医辨证过程设计一个具有规范化和客观化的整体框架,并以慢性乙型肝炎为例建立混合智能中医辨证系统,为中医临床实践提供现代化的技术手段。由于当前应用于中医证候分类研究的方法繁多,但仍没有一个普遍适用的方法,而且由于中医证候的复杂性、多模式性等特点,也使得证候辨证过程不能简单的使用某种单一技术来模拟,为此借鉴复杂性科学研究的理论和方法进行证候研究成为可能。本文将在中医辨证的研究现状和相关智能算法的基础上,提出适合于中医辨证的理论方法和系统实施方案。1.基于多视图的混和属性选择属性选择作为一项重要的数据预处理技术,主要目的是识别和消除样本的属性集中与预测结果不相关的或冗余的属性。中医数据集包含从主、客观手段获取的数据,其样本数量有限,但属性种类繁多且性质不同,正确有效的属性选择是构建中医辨证模型的重要基础。现有的属性选择方法很多,但都不能全面的获取与证候密切相关的关键属性。本论文提出了基于多视图的混合属性选择方法MVHFS(Multi-View Based Hybrid Feature Selection)。该方法利用领域知识,将原有的整体属性空间分割成中医症状、中医体征和西医指标视图,并在每个视图中分别运行由多个基于filter模式的属性选择方法构成的混合属性选择算法,提取和每个证候密切相关的中医症状、中医体征和西医指标。该方法从中西医两个侧面提取证候的关键属性,且得到的构成每个证候的关键属性集不同,体现了证候之间的差异,为后续证候辨证模型的构建奠定基础。2.结合分布信息计算属性权重属性权重是属性重要程度的一种主观评价和客观反映的综合度量。在中医辨证领域,不同的属性对证候诊断的重要程度和作用是不等的,一个属性的作用越重要,其相应的权重就越大。在中医领域常使用属性整体出现的频率来计算该属性的重要程度,并不考虑在证候间分布的信息。本文提出了一个改进的TF-IDF算法,用于计算属性权重,可显示的区分不同属性对证候的作用,也可量化的显示出即使同一属性对不同证候的作用程度也是不同的,符合中医理论,也为后续证候辨证模型的构建奠定了基础。3.基于属性选择的混合智能中医辨证模型中医辨证的本质是证候分类。现有的分类方法很多,但由于中西医属性和证候之间的关系比较复杂,用单一分类器或单一模型很难提高其辨证精度。除此之外,在中医诊断学领域,获取每位患者的类别概率估计是非常重要的,基于此才能准确的为每位患者设置其用药和治疗方案。为此,本文引入混合智能系统理论及其思想,选用BayesNet、改进的概率决策树(WPET)和改进的分类关联规则分析(WCBA),进行加权融合,构建了一个基于属性选择的混合智能中医辨证方法。通过实验对比分析,该方法不论是对UCI标准数据集还是对慢性乙型肝炎数据集都有很好的性能,证明了该方法的有效性。而且通过对180例慢性乙型肝炎未标注新样本的预测,展现了该方法应用于临床实践的美好前景。4.辨证系统的开发在研究中医辨证过程和方法的基础上,论文研发了针对慢性乙型肝炎病例的中医辨证系统原型,该系统利用所提出的属性选择算法,可获得与每个证候密切相关的属性子集;使用改进的属性权重计算方法可获得与每个证候各自密切相关的属性的权重;使用系统的混合辨证模型可以判别新样本的主要证候和次要证候;并在新样本和新技术的增加过程中,系统的辨证模型将得到不断完善。