kNN分类算法研究及其在中毒诊断中的应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:virtualboxscdl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据分类技术是一种强有力的分析手段,它旨在生成一个分类函数或分类模型,由该模型把数据库中的数据项映射到某一给定类别中。现有的数据分类算法大体可以划分为两大类:积极学习方法与消极学习方法。其中消极学习型中应用最广泛的是最近邻分类算法。由于消极方法使用很多不同的局部线性函数来形成对目标函数隐含的全局逼近,具有比积极方法更丰富的假设空间。因此对消极方法及其应用的研究是一个非常重要的课题。 本文首先分析了K近邻(kNN)算法的理论基础及实现方法,然后分析了kNN算法的相关特征,包括kNN算法的计算复杂度、分类精确度及存储开销等问题。 针对最近邻算法在数据分类中存在的问题,本文提出一种预聚类处理的加权kNN分类算法模型,即通过对训练数据集进行预处理,分析训练数据集的特征,对其进行聚类处理并建立分类模型。实验证明,新的算法不仅能有效缩减原kNN算法在分类过程中的计算开销,而且能够自动确定最佳的k值,且分类精确度较经典的kNN算法有所提高。 为了满足中毒分类系统的需要,本文基于P-tree数据结构提出了一种改进的P-trees kNN分类算法。算法根据不同临床中毒表现对应不同毒物的权值向量构成“中毒表现加权向量表”,并将它作为训练数据集的属性值;构建中毒表现加权向量表的P树,并选择HOBBit距离作为距离度量标准,运用P-trees kNN分类算法进行毒物分类。运用医学临床毒物数据作为实验数据进行实验后得到的实验结果表明该算法能够取得令人满意的分类精确度。 基于相关的算法,并结合中毒诊断及毒物咨询的实际应用需要,一个B/S体系结构的毒物分类系统原型得以实现。该系统提供了相关必要的功能,能作为医学中毒诊断的计算机辅助工具而直接应用于医学界,具有较高的实用价值和良好的市场前景。
其他文献
随着后PC时代的来临,新兴的数字网络无不与嵌入式系统息息相关。诸如信息家电、传感器、通信产品、工业控制器、掌上电脑(PDA)等各种各样的嵌入式系统,早已融入了人们的生活
随着信息技术和网络技术的发展,各种新型的智能终端设备愈加普及,网络服务也日益丰富,信息服务正逐渐向能随时随地为人们提供透明服务的普适计算环境过渡。作为普适计算中的一种
早在上个世纪六十年代,Dobzhansky和Sturtevant发表了一篇重要的论文,其中证明了两个不同物种Drosophilia pseudoobscura和Miranda的染色体基因序列可以通过基因组的17次反转来
随着大众对便携式娱乐产品的不断需求,便携式多媒体播放器(Portable Multimedia Player)已逐渐成为数码影音领域中便携式娱乐设备的主流。在深入分析了市场需求及主流产品解
面对机遇产品的竞争环境,企业要在短时间内,合理的成本限制下组织完成机遇产品的研制与开发,以最大的敏捷性响应市场需求,通过具有敏捷性的企业间协作,将各个企业的核心资源
在互联网信息日益膨胀的今天,搜索引擎成为人们获取信息必不可少的工具。但随着信息量的增大和行为方式的增多,传统的搜索模式逐渐暴露出许多问题,如词汇孤岛问题、表达差异
用户界面是系统使用者与系统进行通讯的接口,图形用户界面仍然是当今软件的主流交互界面。那种将用户界面固化在软件中的开发技术已经不满足平台多样化发展的需要,软件可运行的
本文在网络层和MAC层上对无线自组网上四个方面的节能问题进行了研究,主要研究成果如下: 最大化系统生存时间路由问题:针对该问题,在网络层提出了无线自组网上一个以最大化系
本文在对北京地区学分制试点职业学校充分调研的基础上,分析了学分制管理信息系统的需求,充分考虑了系统程序代码作为学校计算机类专业动态网站设计课程教学案例素材使用的要求
网络存储系统的性能不仅与存储设备本身有关,而且与网络的通信性能有着密切的联系。传统网卡技术存在内存的冗余拷贝和较高的中断频率,这种不足导致的直接后果就是高的CPU负