基于混沌粒子群算法的网络文本信息过滤技术研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:tianzhihen1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,政治、经济、贸易、文化等行业的区域化、全球化的飞速发展,使当今社会信息量急剧增加。丰富的信息源虽然给人们获取知识带来了便利,但同时也迫使人们花费大量的精力从中查找有用资源。另外,Internet并不是一个完全封闭的环境,更不可能是一方净土,暴力、色情、反动等文化垃圾的侵扰,使人们的身心健康受到了严重影响。因此如何轻松准确定位感兴趣的信息,滤除无关或非法的不良信息已成为信息时代的重要任务之一。信息过滤技术是解决上述问题的有效方法,由于目前网络上的绝大部分信息都是文本信息,因此,本文的研究也主要针对文本信息的过滤处理。本文对基于内容的网络文本信息过滤中所涉及的关键技术进行了探讨,并重点研究了基于混沌粒子群算法的过滤模板构建方法。主要工作包含以下三个方面:1、针对PSO算法易发生早熟等问题,提出了一种改进的混沌PSO算法该方法根据混沌序列具有良好遍历性的特点,使用立方映射产生的混沌序列对粒子位置进行初始化,增强全局搜索的多样性;然后使惯性权重随粒子适应值而变,以提升收敛速度;当算法陷入早熟时,采取混沌扰动策略,使算法跳出局部最优。实验结果表明,无论从收敛速度还是收敛精度来看,改进算法都有了明显提高,并且能有效地避免早熟。2、提出了一种基于改进粒子群算法的过滤模板构建方法该方法采用改进的混沌粒子群算法对特征子集进行优化,并提出一种基于相似度、分类准确率及特征个数的粒子适应度评价体系。另外,考虑到粒子每一代更新都需要训练分类器,将增加算法的时间复杂度,因此采用并行计算方法进行加速。实验结果显示,用该方法进行特征选择,能够有效而且快速地抽取出问题空间的最优特征子集。3、设计并实现了基于以上改进策略的网络文本信息过滤系统将本文提出的基于改进的混沌粒子群算法的过滤模板构建方法应用于网络文本信息过滤系统中,根据用户的需求实现网络信息的实时过滤,提高过滤系统的效率,并保证系统的过滤准确性及稳定性。
其他文献
鼻形识别是一种新兴的生物识别方法,近年来受到了越来越多国内外研究者的关注。和现有的生物特征识别方法相比,鼻子最重要的特征是不易改变性,稳定性,难以隐藏性等,并且能够采取非
随着互联网的飞速发展,大数据的价值也得到了越来越多的重视。作为大数据研究与应用的基础设施,大数据存储系统显得尤为重要,HBase便是其中一款典型的非关系型数据库。当前HB
对放入其中的磁体有磁力的作用的物质叫做磁场.磁场的基本特征是能对其中的运动电荷施加作用力,即通电导体在磁场中受到磁场的作用力.磁场对电流、对磁体的作用力或力矩皆源
在可靠性方面,信道编码能够有效地降低数据传输出错的概率,而在众多的编码方案中,LDPC码具有良好的纠错性能以及较低的译码复杂度,已经成为通信领域的研究热点之一。在有效性方面
学位
CCD空间遥感器作为一种特殊且典型的光机电一体化的成像光学仪器,在国家建设和国防安全方面扮演着重要的角色,因此,空间遥感器技术的研究和应用受到世界各国的普遍重视。随着遥感器应用技术的发展,体积小、重量轻、大视场、高分辨率的空间遥感器以及小卫星平台是未来空间观测的一个重要发展趋势。本文对系统内大气传输、光学系统、探测器、电子学系统等多个单元进行建模然后汇总建立了CCD遥感器全信号通道传递函数(MTF
石油产品存在水分属于有害物质,直接影响石油产品的质量。所以水分的含量多少在油品规格中都作了严格的规定。本文通过对航空喷气机润滑油(8A)和ZL-67荧光渗透液采用不同溶剂进
视频是人们获取信息的一种重要手段。为了获得视频数据,就要进行图像数据采集。作为视频采集系统的核心,视频采集卡的设计十分重要。其中基于PCI总线的视频采集卡以其优越的性
胡适所生活的时代,是社会矛盾和民族矛盾十分激烈的时代.青年学生们纷纷走上街头,用语言和行动,表达心中的不满与抗争,出现了多次大型学生运动.胡适,作为新文化运动的领袖之
期刊
学位