结合语义和文本特征位串的高效KNN算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:jackydu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了有效提高文本分类的效率,提出了一种基于语义相似的改进KNN算法。该算法结合了特征词的语义和文本的特征位串,由于考虑到文本向量中同义的关联特征词对文本相似度的贡献,有效地提高了文本分类的准确率和召回率;而基于文本特征位串进行的位计算方法,能从大量的训练文本集中筛选出可能的相似文本,较好地克服了KNN算法计算量大的问题。算法的分析与实验表明,改进的算法明显提高了KNN的计算效率,同时也提高了分类的准确率和召回率。
其他文献
为进一步提高城市建筑三维重建的质量,提出一种基于MVS点云进行表面重建的方法。通过统计分析滤波有效去除点云表面和周围的杂点,使用点云分块和高效RANSAC完成平面模型的快速拟合。实验对比结果表明,该方法可以有效恢复建筑物平面和尖锐特征,改善了表面重建模型的质量;将该方法应用于大场景建筑物建模中,验证了其具有良好的适用性,对虚拟城市三维环境的构建有一定作用。
期刊
自变频器于1990年被引入中国市场以来,众多世界知名变频器品牌也陆续进驻中国市场,以本土化战略落地生根,逐步扩大国内市场占有份额。
目的调查护理本科生情绪管理能力现状,为护理教育者开展情绪管理辅导提供参考。方法采用一般资料调查问卷、大学生情绪管理能力问卷对上海中医药大学全体2014~2017级共457名
一、程序存在于一切物质运动中什么叫程序?所谓程,讲的是规章、制度或形式;序,讲的是区分或排列位置.程序是指事物运动的某种次序或过程或环节,含有某种秩序或顺序的意思.
"黄金分割"亦称"最佳分割".领导讲话中的"黄金分割",是指对讲话时机、内容、长短、风格等度的把握问题.笔者之所以提出这个问题,是由于目前领导工作中普遍存有下属和群众怕领
期刊
针对电路设计流程中静态定时问题,介绍了基于时间窗口和跳变图的考虑串扰的静态定时分析方法。通过判断受害线和侵略线的时间窗或跳变图是否有交叠,筛选出可能产生串扰效应的耦
鼓掌,俗称拍手,电视中天天有节目主持人似是而非的台词:“掌声有请。”意思是大家都能领会的,就是要大家用鼓掌来欢迎表演者登台。