论文部分内容阅读
由于存储在医疗数据库中的知识和数据具有广泛性,这就对数据的存储、连接、分析及被存储的知识和数据能够有效地使用的专业工具提出更高的要求。在Edward H. Shortliffe文章“人工智能在医疗中正处在青春期”中提出影响人工智能成功应用于医疗的三个因素:训练的增强、国际标准和信息的底层结构。从1993年起,信息的底层结构就已经较其余两个因素有很大发展。实际上,医疗资料学(研究资料的搜集、分类、储存等的学科)已经成为医疗机构的重要组成部分。许多现代化医院和健康中心都配有监视装置和数据收集设施,使数据能被收集且在连接的网络上共享。现代化的医院正快速发展其信息系统,从前曾是一个单独的数据库或单独的实验室信息系统,现在都被连接成一个大规模的医疗信息系统。数据量的增加引起决策支持引用有用信息的困难。传统的手动数据分析已经远远不能满足要求,基于计算机的有效分析方法成为必不可少的技术。例如,在智能数据分析领域中发展的技术,尤其是数据的抽象和数据的挖掘。智能数据分析(IDA)包括统计、模式识别、机器学习、数据抽象和可视化工具。他们的作用是数据收集和数据理解的桥梁,目的是更有效地执行医疗工作。信息革命的到来使之通过电子媒介收集和存储大量数据成为可能。如今,由于数据比较容易获得,使合成函数在医疗领域得到应用。当合成数值型数据时,主要的算法有两个WM和OWA。这两个函数的不同之处在于权的涵义和如何根据输入数据合成权。确切地说,WM算法中的权衡量的是信息源的可靠性,而不管数据源所提供的数据。相反,OWA算法中的权衡量的是这些数据之间的相对关系而不管数据是由什<WP=44>么来提供的。为了利用两套权的优势,我们提出了WOWA算法,它合成了两种函数的优势,既考虑了使用者加权信息的可靠性,同时又考虑了数据间的相对位置。本文把医疗与数据分析结合起来,用模糊知识和智能合成技术解决医疗诊断的难题。即睡眠呼吸暂停症状的检测。呼吸暂停是难以诊断的病例,目前还没有比较满意的标准统计模型技术来解决此病例。我们认为主要问题是由于“问卷回答”作为数据的内在模糊性。本文用模糊法来对“问卷回答”进行表示,把所获得的知识作为病人回答问题的隶属度,并且作为用于睡眠暂停呼吸症状诊断的最后合成值。采用可靠性和相关性权的形式表示知识,用两种不同的数据合成技术(WOWA,OWA)熔合每个病例诊断中不同的变量,OWA(ordered weighted average, OWA)算子考虑数据之间的相对关系,WOWA(weighted ordered weighted average, OWA)算子用两组权考虑两方面的因素,从两套权计算一套新的权。同时,我们提供了获得相关权的方法——遗传算法(genetic algorithms,简称GA),并与医疗专家所定义的相关权相比较。Op是WOWA预测的诊断,Or是标准化RDI值,是一个实际的诊断。对于所有患者病例,目的是减少在总数Op和总数Or之间的差值。即: Min(ΣOp-ΣOr) 我们能用遗传算法技术从医院所得数据值获得ρ(相关性)权系数。遗传算法模仿自然选择的过程,从当前一代到以后选择最适合的生存。遗传算法有一套输入和输入数据。一套可以更改的值,一套强制限制(在本文中为加权系数总和为1)和一个目的函数,在我们这个病例中是减少预测诊断和实际诊断的差值。我们通过遗传算法技术使输入和输出相接近找到相关性权,而减少目的函数。