基于Rough集理论的信息过滤研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:www_073
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展,给人们的学习、工作和生活提供了大量的有益进步的信息,带来了极大的便利,与此同时在大量进步有益的信息的背后同样存在着大量不良的信息,尤其对青少年的身心健康造成了极大的伤害。为了在动态的信息流中能根据用户的信息需求搜索用户感兴趣的信息,屏蔽其它无用和不良的信息,信息过滤技术应运而生。Rough集理论是一种处理不精确、不一致、不完整等问题的数学工具,无需提供问题所需处理的数据集合之外的任何先验信息,可直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。自20世纪80年代末以来,关于Rough集理论和应用的研究逐渐成为智能信息处理领域的热点问题。本文是基于Rough集理论的信息过滤系统研究,把Rough集理论的属性约简方法应用到信息过滤上,对不良信息进行过滤。本文主要工作如下;1.概述了Rough集理论、信息过滤技术的发展趋势和研究现状,以及相关的理论知识和相关技术。2.详细介绍了信息过滤之前数据预处理方法,特征提取方法等,并针对Rough集理论只能处理离散化数据问题研究分析了目前几种离散化方法,针对本实验系统,对Naive Scale算法进行了改进。3.讨论了几种属性约简算法,在仔细研究阅读相关文献的基础上分析了各算法的优缺点,最后给出了基于差别矩阵的改进算法,用数组存储差别矩阵元素,存储前进行冗余元素的删除,简化了差别矩阵,提高了效率,并将其应用到信息过滤系统中。4.最后在完成基于Rough集理论的信息过滤系统实验的理论研究的基础上,将其理论应用于实践,构建了一个信息过滤系统模型,并给出了实验结果,实现不良信息的过滤。利用Rough集的属性约简理论降低了信息的冗余度,提高了准确率,实现较好的过滤效果。
其他文献
概念格是一种完备的数学模型,描述了概念内涵与外延之间以及泛化与例化之间的关系,因而适用于数据和知识的表示以及包括分类、关联、序列和聚类等多种知识发现问题的描述。随
随着web2.0技术的发展,出现越来越多的应用帮助用户区交换观点和分享知识,在这些web2.0的平台中,社区问答系统成为一枝独秀,吸引着越来越多的用户参与其中,它弥补了传统搜索
在自然科学、社会科学及工程技术等许多领域,普遍存在着按时间顺序发生的具有概率特征的各种随机现象,通过观测把这些现象记录下来便成为可供分析的随机数据。所谓时间序列通
USB总线接口技术具有即插即用、高可靠性、低成本、低功耗、自动配置、容易扩充、易于连接、适用于多种设备的广泛适应性等特点,广泛应用于PC机的外设设计中,但是以USB总线接口
在制造型企业中,根据已有的资源,包括原料、工具、机器、工人等的具体情况,以及各种约束条件,对现有订单需要生产的产品制定生产计划是一项非常重要的工作。生产计划的质量,直接影
近年来,随着Internet技术的飞速发展,Web服务已经成为新兴的一种分布式计算模型。它能够实现在不同平台上、不同程序语言开发的应用程序之间无缝的互操作。Web服务的大量涌现使
面向Agent软件需求分析技术作为一种新的在更高抽象层次上建模软件的技术,对传统的软件需求分析方法提出了挑战,但同时也带来了新的机遇与发展。在传统的需求分析技术(面向对
移动Agent系统主要包括移动Agent及其运行环境,后者位于网络节点上,为移动Agent实例提供运行所需的环境和系统的功能支持。移动Agent的最重要特点是它具有移动性,即它可以自
Web服务采用了通用的基于标准的协议和技术,便于用户访问,但这种方便也带来了安全性的隐患,因此Web服务的安全性成为研究热点。本文首先介绍了XML和Web服务的基础知识,并在此
对大型燃煤锅炉而言,炉膛火焰数字图像处理技术可以很好的监控炉膛火焰状况。图像分割技术是计算机图像处理领域所研究的核心问题之一,本文将其应用于炉膛火焰图像的处理与分