基于内容的短信息过滤系统研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:szjisu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾短信问题日益严重,受到社会的广泛关注。基于内容的过滤是当前解决垃圾短信问题的主要技术之一。 本文系统地介绍了与垃圾短信过滤相关的短信息传递过程、自然语言构造表示的四种模型以及当前在文本过滤领域主要应用的三类过滤方法。分析研究了垃圾短信文本的一些内容结构特征以及解决的方法。应用中科院计算所研制开发的FreeICTCLAS分词系统,实现了短信语句分割到具体词的转换,为进一步分类计算奠定了基础。引入朴素贝叶斯算法和最小损失因子,对传统的贝叶斯过滤方法进行了改进,提高了其分类的准确率。此外,还构造了10个垃圾短信的模型,通过应用《知网》和KNN算法计算语义相似度,进行了语义过滤的研究。综合以上技术,本文设计了一个基于内容的手机短信息过滤系统。该系统的核心是构造分类器。在构造分类器过程中,运用BP神经网络技术,把贝叶斯过滤与语义过滤两者有机地结合起来,实现了参数的最佳拟合。最后,对整个系统进行了实验测试,正确率为70%。 本文虽然完成了整个系统的构建,但尚存在不完善之处,需要做进一步深入细致的研究。
其他文献
随着多媒体技术和网络技术的发展,人们对图像压缩技术的要求越来越高,传统的JPEG已经无法满足应用的需要,JPEG2000应运而生。 JPEG2000在目前的图像压缩技术中是最先进的,它已
期刊
期刊
期刊
期刊
期刊
期刊
期刊
随着无线通信技术的发展,多媒体视频、音频在当今社会起着越来越重要的作用。MPEG-4 是一种视频压缩规范,采用先进的压缩技术使得视频在极高的压缩率下仍然能够展现很好的品质,
随着移动通信的发展,移动IP技术目前已经得到了非常广泛的应用。由于对网络容量和通信带宽要求的不断提高,在实际工程中无线小区的覆盖范围已经出现大幅减少,从而导致小区切