论文部分内容阅读
随着移动互联网时代的到来,智能终端正深入到人们生活的各个方面。当人们使用智能终端上网或者接收邮件、短信时,其中总是掺杂了大量的垃圾信息,它们不仅耗费大量的存储空间,还造成了糟糕的用户体验。本论文就从智能终端的局限性出发,提出了一种改进后的信息过滤算法,并基于该算法实现了一款信息过滤系统,使其更适用于智能终端。
本文首先介绍了当前信息过滤的研究现状和现有的文本分类模型,并从性能和功能上比较各个分类算法的优缺点,分析各个算法的适用范围,结合智能终端的CPU速度、内存和ROM空间的限制,最终选择对贝叶斯算法进行改进。然后,本文从现有改进方法中寻求切入点,提出了一种基于综合权值以及样本增量的贝叶斯算法,经验证,改进后的算法可以有效地提高文本分类的准确率和学习效率。最后,根据改进后的算法,实现了基于智能终端的一款信息过滤系统,并对系统进行了详细而全面的功能测试和性能测试。文章最后对此信息过滤系统以及相关改进点进行了总结和概括。
虽然信息过滤算法有很多种,但是现有的大部分算法,在信息过滤的准确率和效率方面仍然不是很高,由于手机操作系统的高要求性,这些算法并不能满足现实的需要。而本论文实现的这款信息过滤系统,相比较其他的安全防护软件,垃圾信息的拦截率和学习的效率都得到了很大的提升。