一种高效垃圾短信过滤系统的实现

被引量 : 0次 | 上传用户:xiaoxuan415315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,通信领域中手机接收垃圾短信的数量成螺旋式增长,该现象如不加以防范,将导致垃圾短信泛滥,严重骚扰手机用户,并且为人们正常使用手机进行交流和沟通带来了极大的不便,有些违法短信和不良短信也带来了一定的社会危害。本文主要研究并提出了一种适用于对互联网发送的垃圾短信进行监控和过滤的解决方案,该方案根据短信日发送频度、短信内容、短信长度等特征,采用模糊匹配和频度监控相结合的方法进行短信监控和过滤。系统中根据笔者观点提出了内容与变换、关键字加权控制频度等方法,通过在机房多次实验,结果表明,本系统在过滤准确度和误判率两方面的幅度指标分别提高了22.1%、30.3%。在短信资料方面,本文采集了5000条短信,包括正常短信和垃圾短信并且从中选择了部分短信内容进行深入分析,总结提取了正常短信和垃圾短信的特征,为以后的过滤研究打下了基础。同时这些短信资料也将作为实验系统的研究和测试资料。在系统框架设计中,首先考虑了实现途径和过滤原则,并简要介绍了当今治理垃圾短信最常见的两种算法,分别为:根据文本内容进行过滤、对包括黑名单的短信号码的短信进行过滤(黑名单过滤)。通过对这两种基本算法的介绍,指出了它们存在的不足。并且根据手机用户对垃圾短信的过滤需求,提出了垃圾短信的过滤原则,即“宁可放过,不能错杀”。这样的原则在一定程度上增加了判断垃圾短信的难度,会造成对垃圾短信的误判和漏判。在核心过滤算法方面,借鉴了目前成熟垃圾短信的过滤方法,根据当前垃圾短信反过滤的新动向以及针对现有垃圾短信过滤算法的缺点,提出了这种高效垃圾短信过滤系统,选取了三种过滤方法,即短信内容预处理算法、关键字加权控制发送频度算法、短信内容长度对发送频度的修正算法。其中,短信内容预处理算法,可以有效地解决普通关键字匹配算法容易受内容替换干扰的缺点;另外,为了避免仅仅依靠关键字过滤容易引起的误判,系统采用了关键字加权控制发送频度的算法,使误判率明显降低;再次,结合垃圾短信的长度特征来调整它的发送频度。
其他文献
本文研究的主要目的是从利益冲突的角度对国有上市公司的重组绩效进行评价和研究。围绕这个中心,本文主要研究了以下几个问题:第一,国有上市公司重组应遵循怎样的原则;第二,国
论文以“十八描”作为研究对象,力求将其作为一个美术史概念来探讨,发掘其历史演变中蕴藏的美术史与文化史意义。“十八描”在明代邹德中《绘事指蒙》中最早提出,因此,论文对
对证券投资者人格类型进行分类,进一步探讨证券投资者人格特征对投资决策以及投资行为的影响,进而据此提出有针对性的投资建议,是金融心理学最新的研究方向之一。本研究主要
随着信息化时代的到来,电子文档逐渐取代了纸质文件,成为人们日常工作、学习中必不可少的数据存储方式,随之而来的问题便是如何保证这些电子文档资料的安全,防止它们被未授权
碳四烯烃是重要的化工资源,在加工的过程中,以铜、铁、镍等金属为主的催化剂,容易与有机硫生成稳定的硫化物而降低活性和生产能力,因此,对碳四烯烃中有机硫化合物进行深度脱
分析了企业电子商务网站的成本及收入构成,建立了网站的成本模型、收入模型和投资效益模型,并分别对各模型进行了具体的分析,为企业的投资决策提供参考.
目的:观察通任种子汤口服及通任种子汤配合中医综合疗法治疗气滞血瘀型输卵管阻塞性不孕症的疗效,分析影响疗效的因素,比较两种方法的疗效差异。方法:随访自2007年2月至2009年2
国家形象对于一个国家来说是一笔极其重要的无形资产,它的地位和塑造与对外政策的执行和国家利益的获取有直接的影响。国家形象及其塑造一方面同国家自身的综合实力有密切关
随着我国改革开放的不断深化以及社会主义市场经济体制的建立和完善,人们的法制观念不断加强,自从我国律师制度恢复以来,律师在维护法律的尊严和统一,维护社会稳定方面做出了
随着数字化通信的发展与计算机技术深入到生活的各个领域,物联网应运而生。物联网的诞生给普适计算提供了基础,成为了当前研究的热点。物联网强调“物物互联”,从而创造一个