基于深度学习的短信分类技术研究

来源 :长安大学 | 被引量 : 9次 | 上传用户:slyde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的迅猛发展,手机短信凭借其价格低廉、使用便捷和传递可靠等优点,成为人们日常生活中必不可少的联络手段,在各个领域得到了广泛的应用。然而,短信的大量使用在信息安全方面带来了一定的隐患,例如垃圾短信的泛滥。正因为这样,如何保持短信业务健康发展的同时避免垃圾短信造成的不良影响成为一个亟待解决的问题。深度学习是机器学习研究中的一个新的领域,能够自动地提取所需要的特征且良好地表达特征。尤其是对大规模数据进行处理时效果非常好。本文研究的重点是如何将深度学习与文本分类技术相结合对短信进行分类,从而减少短信带来的负面影响。本文主要针对目前的短信分类技术准确率不高的问题,提出以文本分类技术为基础,结合深度学习算法来对短信进行分类。主要的方法是:将收集的短信数据集作为研究对象,对数据集中的短信进行预处理和特征选择,短信以向量的形式作为深度信念网络的输入神经元,输出神经元根据分类的类别标签个数所定,运用深度信念网络对样本进行训练和测试,得出分类结果。实验研究结果表明,深度学习方法能够无监督的学习短信信息,可以用于短信分类。而且短信数据集规模越大,分类效果越好。
其他文献
随着现代教育事业的发展和计算机教育的普及,无纸化、网络化考试已成为一种必然的发展趋势,其不仅可以大幅度减少考试工作量,同时自动化阅卷也可以在一定程度上降低人为因素带来
随着互联网技术的不断发展和应用领域的不断扩大,嵌入式系统越来越多地提供了各种基于互联网的应用服务。而互联网安全问题,也成为亟待解决的问题之一。在电子商务领域方面,
当前的在线诊断系统多依靠传统的传感器、工业以太网等局域网实现数据的分布式采集和传输,系统的安装实施受现场条件的限制,而且信息检测点不易更改和扩充。而应用无线传输技
Internet、软件形态、分布式计算技术的迅猛发展,促成了几个概念模型的逐步实现,包括网构软件、网格计算和云计算等。这些分布式计算的概念模型在理念上有相同之处,但又各有
PACS已经成为了现代医学放射学实践的基本技术和基础设施中重要的一部分,在临床诊断、医学科研等方面正发挥着极其重要的作用,随着医疗技术水平的不断发展,医学影像数据越来越宠
在计算机视觉领域中,人体运动行为识别是一个被广泛关注的热点问题,在智能监控、机器人、人机交互等方面也有巨大应用价值。本文主要研究的是视频图像序列中基于时空特征点的
随着计算机网络和多媒体技术的飞速发展,多媒体数据逐渐成为人们获取信息的重要来源。然而,当前数字信号处理和互联网传输技术的迅猛发展却令数据的版权保护面临严峻的挑战。
基于构件的软件开发(CBSD)是软件工程化开发和工业化生产的必然趋势,软件产品线方法通过对整个产品家族进行统一的组织和管理,从而提高软件的质量和生产率。基于特征的领域建
SyncML协议是由SyncML initiative发行的为实现移动数据库同步的一种开放性工业标准协议。如今基于SyncML的产品和服务越来越多地出现在市面上,这也让终端用户对移动数据同步
Internet、移动通信技术和其他技术的完美结合创造了移动电子商务,移动电子商务以其灵活、简单、方便的特点开始受到消费者的欢迎。它的出现极大地推动了电子商务的发展。 
学位