短信文本分类技术的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:racerdan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短信作为一种重要的交流手段,发挥着越来越重要的作用。但伴随着短信的广泛使用,垃圾短信则严重影响着人们的生活,因此文中基于短信文本特征词对短信进行分类研究。其中,TF-IDF特征词权重计算方法是对文本词汇权重计算的一种经典算法,得到了广泛应用。但此方法为了简化计算,忽略了词语之间的相互关系。针对此问题,依据同一短信文本中的词汇之间存在的相互关系,文中对权重计算法进行了调整,提出了基于模糊K均值的短信文本分类算法。即先将短信文本集用TF-IDF算法处理,得到词汇-文本集,再用模糊K均值算法对得到的词汇-文本集
其他文献
在SINR模型下研究了无线网络中与链路调度密切相关的两个重要的NP一完全问题:最大链路独立集(Maximum Independent Set of Links,MISL)和最大带权链路独立集(Maximum Weighted Ind
电阻抗成像是一种新型的医学成像技术,在生物信息检测与成像方面具有广阔的应用前景。针对现有电阻抗成像系统采集速度不高、实时性较低、分辨率不理想的情况,进行了改进设计。
在生产预警有效影响因子的筛选过程中,为了达到降低维度,增强影响因子集的有效性,从而提高生产异常预警准确率的目的,选取和分析所有原始项目,应用模糊综合评价法量化模糊限
议题凝练学科知识,又蕴含价值判断,是促进学生认知、体验、感悟的载体。议题是活动型课堂的重要抓手,对于激发学习动机,提升自主建构能力、政治思维能力、知识迁移运用能力等
为了充分利用无线Mesh网络广播传输的特性,并提高网络吞吐量,提出一种基于编码收益的Mesh网络机会路由协议(TheCoding—Revenue Opportunistic Routing,CROR)。该协议对多个数据包
文言文的拓展学习有两条有效的途径,一是语用,二是情感。基于语用的拓展学习,要从活选教学点、巧选空白点和精选语用点入手,针对小学文言文中一词多义、古今异义等常见的语言