kNN算法在手机短信客户端分类中的应用研究

来源 :山东农业大学学报:自然科学版 | 被引量 : 0次 | 上传用户:SK_flyfox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究并实现了kNN算法的手机短信客户端分类系统,从自建的短信语料库中提取到正常短信和垃圾短信两个特征向量集,通过预处理、降维和去除词频过小的特征项,使特征向量集可最大程度的载有该类短信的特征项。短信语料库分成比对库和测试库两部分。研究发现,比对库的短信数量n取600时分类效果最好,过小则降低短信的识别率,过大则提升分类时间复杂度,近邻数k取25时效果最优。同时研究了当k条短信选取时的概率差在1%~2%时,短信类别确定时的数量差在5到15之间时,效果最优。遵循保证正常短信的通过率的同时加大垃圾短信识别率的原
其他文献
新媒体在传播中的社会责任主要表现在对主旋律进行弘扬,对正能量进行传播等方面。这就需要相关媒体工作者必须要对正能量议题进行报道,从而对受众进行积极引导。对此,国家需
网络新媒体给高校突发性事件危机公关带来了重大机遇和严峻挑战。新媒体一方面加剧了高校突发事件的发生频率、严重程度和公关难度,另一方面也为高校危机公关了提供了新的载
广播节目是广播电台所有播出内容的表现形式,优秀的主持人能够通过合理运用艺术的语言表达和音响元素,综合反映社会生活与人文情感,并给人以美的享受。因此,节目主持人的语言
程序可靠性验证往往占用软件开发周期很长的时间,而现行的软件可靠性验证方法主要是基于形式化的方法如基于SPIN 的模型检测方法等,但这种方法可能由于模型建立的问题导致验
目的探讨Orem自理模式在骨科康复期护理中的运用效果。方法 2009年1月~2010年10月在我院进行治疗的78例骨科患者随机分为对照组和观察组各39例,分别予以常规护理模式和Orem护
电视新闻是目前应用和推广均较为普遍的媒体形式之一,在新闻等方面报道信度高、效力强。新闻节目是电视媒体的关键要素,但是新闻的编辑工作却是影响节目效果的重要一环。所以
相比于日本动漫,目前我国国产动漫还存在一定的差距,但是近几年来国产动漫优秀之作越来越多,而且很多产品在动漫王国日本成为爆款。
随着计算速度的飞速发展,并行计算系统中,任务调度是解决多任务多资源情况下的最有效办法,但是目前常见的任务调度问题是一个NP-Hard问题,在任分配的负载均衡上还存在不足之
<正> 黎城湖位于淮河下游,介于洪泽湖和高邮湖之间,水草资源相当丰富,为了鼓励渔民由捕捞型向养殖型过渡,增加渔民的经济收入,1998年初,金湖县水产技术推广站选择了黎城湖两
<正> 淇河鲫鱼原产于河南北部淇河中,80年代初期移入池塘养殖,属优质淡水经济鱼类。它对生活环境的适应能力强、生长发育较快、个体大、疾病少、易繁殖,而且体高背厚、含肉率