基于数据挖掘的案例库维护方法研究

被引量 : 11次 | 上传用户:ckforme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为从大规模数据中发现隐含知识的有效技术,数据挖掘以及相关算法的研究在近年来引起了人们广泛的兴趣,并被应用到大量的相关领域。同时,随着基于案例的推理(CBR,Case-Based Reasoning)系统在组织知识管理中的广泛应用,案例库的规模也在不断地膨胀,引发了人们对案例库维护的关注。如何采取合适的策略和技术来提高案例的质量,改进案例库访问性能,提高CBR系统的效率和能力成为人们关注的焦点。 基于这个背景,本文以组织中案例库维护的实际需求为基础,从提高案例质量和改进访问性能两个角度出发,研究案例库以及案例访问记录的数据挖掘技术,以及案例库维护技术。 为了支持对案例库的挖掘,本文在面向对象的案例表示的基础上,提出了一种基于加权特征矢量的案例表示方法。以此为基础,对现在的领域无关的案例相似性比较算法进行改进,在数据挖掘中基于该算法建立案例特征的描述模型。此外,本文还分析了案例记录的内容和表示方式,从访问事务和访问时序两个视角来研究案例记录中蕴含的动态的案例访问描述模型。这些工作为案例库维护提供了技术基础。 在对案例特征和案例访问记录进行数据挖掘的基础上,本文从内容维护和性能维护两个方面研究案例库的维护方法。在内容维护方面,以提高案例库的案例质量为目的,本文研究了利用孤立点分析检测不一致案例、利用分类技术完善不完整案例、利用聚类技术检测冗余案例以及利用趋势分析检测垃圾案例等四种维护技术。在性能维护部分,以提高对案例库的访问速度为目标,本文利用数据挖掘改进了现在常用的案例库分层算法,并提出了对频繁使用的案例进行缓存、以及对经常同时访问的案例进行预取两种方法。 论文通过数据挖掘技术来解决CBR系统中关于案例库维护的问题。但是,论文所讨论的方法与技术并不局限于CBR系统,对于各类知识管理系统所需要维护的组织知识资产库,本文的研究工作都具有一定的借鉴意义。
其他文献
脑卒中是当今世界导致人类死亡和致残的主要疾病之一,其病理生理过程十分复杂。血脑屏障(BBB)是位于脑组织和脑血管之间的一个复杂结构,严密控制着血管两侧的物质交换,从而维
咏侠诗是借吟咏侠客来抒发作者的情感和表达作者的见解的一类诗。它兴起于魏晋南北朝时期,经过初盛唐和中唐的发展,在中晚唐走向衰落。在长期的发展中,它逐步形成了自己独特的、
目的建立一种可靠、稳定的大鼠大脑中动脉闭塞脑缺血/再灌注模型(MCAO/R)的制备方法。方法 32只SD大鼠随机分为手术组(20只)和假手术组(12只),模型制作后检测神经功能缺失评
成人是社会的主要群体,从开始工作到年老退休,长达数十年时间的发展——人生过程中最重要的发展阶段,是在某一岗位、组织内度过的,因此创建学习型组织将有助于促进成人的终身学习
目前,我国的基础教育课程改革已进入试点、实施阶段,这促使课程实施研究成为课程专家们关注的热点和重点。而从课程内涵的历史发展、课程实施概念的提出、课程实施含义的辨析、
低渗透朝阳沟油田由于受储层、井网的限制,随着开发时间的延长,开发效果逐渐变差。本文在国内外许多学者关于如何提高油田开发效果研究的基础上,根据朝阳沟油田的具体特点,就如何
鹿茸是养鹿业的主要产品,鹿茸高产是优良种公鹿的重要经济性状之一,因此茸鹿育种工作主要是围绕如何稳定提高鹿茸产量进行的。传统的梅花鹿育种方法存在速度慢、效率低、育种基
<正> 随着社会的进步,人们对高质量生活的追求,使得人们对就医的环境、质量、安全有了更高的要求。国家也出台了一些相应的政策,拟定了一些相应的规章制度。特别是患者安全管
构件化开发方法已经成为应用系统开发的必然途径,EAI和B2BI已经成为趋势和潮流,Web Services技术伴随Web而来,为我们提供了崭新的应用系统开发和集成思路。本文的主要内容就是要
目的探究并分析奥卡西平对创伤性癫痫患者的治疗效果及安全性。方法选取解放军总医院2012年3月至2013年3月收治的创伤性癫痫患者100例,按照随机数字表法分为观察组和对照组,