手机短信过滤方法的研究与实现

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:masdfsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子信息技术的发展以及手机用户的逐渐增多,利用手机短信进行信息传播的商业价值变得越来越大。短信服务在应用过程中和电子邮件系统一样,也出现了大量的垃圾信息。它可能影响用户的正常使用,导致用户误入消费陷阱,还可能对手机系统造成损害或造成数据丢失。反手机垃圾短信的研究显得越加重要和迫切,这已引起国家、各级政府、公安机关和短信服务提供商的高度重视。但是目前国内外还没有手机垃圾短信过滤的实际系统和软件,我们进行手机垃圾短信过滤方法的研究与实现具有非常重大的意义。 和反垃圾短信紧密相关的另一个研究领域是反垃圾邮件。就目前来说,垃圾邮件的泛滥情况远超过垃圾短信。反垃圾邮件研究广受关注,并产生了许多识别技术和过滤方法,并应用与几乎所有大型的邮件系统。这从另一个方面反映了垃圾信息的泛滥。不过,短信服务和邮件系统采用了不同的底层结构和协议形式,因此反垃圾邮件的技术并不能直接应用在反垃圾短信上。 本文先介绍了SMS协议,分析了其网络结构和特点以及当前的SMS应用模式和状况,说明了垃圾短信的发送特征。同时也讨论了手机开发相关的技术。接着提出了垃圾短信的评判标准,说明过滤系统的理论背景,阐述了现有的各种信息过滤方法及其优缺点。随后,针对手机资源受限的环境特点,提出了一种基于朴素贝叶斯的分类算法。根据在手工分析垃圾短信时发现的特征,提出了权重非线性增长的多序列相似性算法。最后,本文介绍了一个手机短信过滤系统“智能短信王”的设计和实现。 本文的创新点在于: 1)提出了垃圾短信的评判标准和评判方法。 2) 针对手机运行环境,提出了具有自学习能力的基于朴素贝叶斯的分类算法。针对短信结构特点,提出了一种基于非线性增益的多关键字序列相似度算法。达到了较好的分类效果和分类性能。 3) 设计并实现了一个运行于智能手机上的短信过滤系统。为用户提供了灵活多样的过滤方法和个性化处理方式,成功地向资源受限的环境中移植了中文分词系统。
其他文献
本文对MC-CDMA系统中的信号检测技术进行研究。文章研究了MC-CDMA系统中预均衡的实现方法以及非理想信道条件对时分双工预均衡MC-CDMA系统性能的影响,定量给出信道估计误差和
本文对Windows平台数据容灾系统的实现进行了研究。文章分正常模式和异常模式构建了系统模型;采用循环队列存储的磁盘日志组织结构;通过位图和原子操作方法实现数据一致性的维
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图象编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是工SO/
汽车从发明到今天已经一个多世纪了。在现代社会,汽车已成为人们工作、生活中不可缺少的一种交通工具。汽车在为人们造福的同时,也带来大气污染、噪声和交通安全等一系列问题。
随着Internet技术的发展,面向服务的计算逐渐成为软件产业界和学术界关注的一个热点话题,它以“软件作为服务”的理念为基本前提,期望以软件服务为基本元素构建Internet开放环境
基于正样本和无标记样本的机器学习方法称为Positive and Unlabeled Learn-ing,简称 PU 学习。PU 学习在现实中有很多应用场景,例如某产品已有的用户数据可以视为正样本,企业
目前,数字图像处理、模式识别和人工智能技术已经被广泛地应用于生物医学领域,并且取得了一些可喜的成果,但关于癌症早期病理性诊断的医学图像处理系统的报道还不多。对癌细
从提出蜜罐概念到现在,蜜罐技术已经有了飞速而显著的发展,其研究也扩展到许多领域,包括伪装欺骗、数据捕获、数据控制和数据分析等。各种蜜罐工具也陆续被开发出来,发挥着它们的
信念修正是agent各种智能行为的逻辑基础。随着对多agent系统的市场需求和科学研究的迅速发展,多agent信念修正具有越来越重要的理论价值和应用意义。目前多agent信念修正研究
数据网格作为一种大型分布式系统,具有数据分散存储、数据I/O吞吐量大、节点间拓扑结构易变等特性。而适应数据网格特性的“动态副本分布”能够为地理位置上广泛分布的各类数