覆盖粗糙集与目录检索研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:zhjjchj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是数据挖掘的一个重要工具,也是粒计算的分支之一。经典的粗糙集理论是由波兰的Pawlak于20世纪80年代提出的。粗糙集通过不可区分关系(等价关系)为不完全和不充分信息的处理提供了一套系统的方法。但是等价关系应用范围有限,Zakowski等将等价关系产生的信息划分推广到信息覆盖,也就是将Pawlak经典粗糙集理论推广到覆盖广义粗糙集理论。近年来,不同的学者提出了多种覆盖粗糙集模型并讨论了一些相关性质和相互联系。本文在覆盖广义粗糙集的基础上,将覆盖粗糙集理论进行扩展,并运用到目录检索中去。主要工作如下:(1)归纳了学者提出的多种覆盖粗糙集模型,这些模型的主要差异在于上近似运算和下近似运算的不同。(2)针对覆盖空间约简后有可能还会存在的冗余情况,本文提出了含约简的概念。(3)在对划分的信息熵及相关定义的基础上,推广定义了适合于覆盖空间的信息熵及约简和含约简中的相关信息表达。(4)结合覆盖空间的结构实际,提出了结构化近似算子,并提出了多层覆盖空间的概念。(5)在多层覆盖空间的基础上,提出了目录树的概念,并讨论了目录树的约简、近似运算等。(6)结合目录检索系统的特点,实现了目录树的生成、更新和相关查询操作,并给出了部分新的查询算子和相近度评价。
其他文献
Web Services discovery is the most important task in the Web Services model to get thebest benefit out of this technology. Researchers have developed keyword ba
随着信息技术的发展,企业在生产中积累了大量的生产数据和经营数据,而这些数据大部分被搁置,没有为企业的生产经营提供有价值的指导。为此,本文利用数据挖掘技术对企业的数据信息
以太网交换机作为接入Internet的不可或缺的关键网络设备,由于其高性能、高转发速度及其价格等优势,已经获得了广泛的应用。   因此,在高等学校计算机网络实验室中,注重学生的
学位
以Gnutella为代表的基于无结构型P2P网络的文件共享系统,已经成为互联网上增长最迅速的应用。但是目前主流的无结构型P2P文件共享系统,基于用户体验的考虑,在查询时往往采用洪泛
手持终端是嵌入式领域的重要应用方向,特别是在检测、通信和信息采集等领域。终端对现场多媒体信息的采集和实时的无线传输可以为下一步的执行做好充分的准备,在实际工作和生
塑料喷嘴在现代工业生产中应用十分广泛。然而,由于生产工艺等各种原因,很容易产生各种气泡缺陷,严重影响产品的质量和应用前景。但是,工艺现场使用人工检测塑料喷嘴中的微小
入侵检测系统普遍存在误报漏报率高、海量信息难以分析等缺陷。随着网络攻击的多样化和智能化,单一技术已难以适应当前安全防御的需求。因此,将多种技术融合起来构建新型入侵
语音是人们最直接的沟通方式,对语音信号的处理一直是目前最为热门的研究方向之一。语音转换指通过语音处理手段改变一个人的语音个性特征,使之具有另一个人的语音特征,但同
彩画是中国传统木结构建筑的一种装饰艺术,具有两千多年悠久的历史,体现了中华民族深厚传统文化的优秀底蕴。然而国内外对于清代皇家古建筑彩画的研究还非常有限,因此,对建筑
构件式的软件开发(CBSD;Component-Based Software Development)代表了软件开发模式的转变,即由“庞大单一平台的,从零开始”的传统模式转变为基于平台独立的第三方提供的已