【摘 要】
:
传统的文本分类中相似度的计算,是根据欧氏空间中向量之间夹角的余弦值来表征的,它根据余弦值的大小来反映文本之间的相互关系。该文则首先建立文本集与码字集之间的1-1对应
【机 构】
:
北京邮电大学信息工程学院,北京邮电大学信息工程学院,北京邮电大学信息工程学院 北京100876,北京100876,北京100876
论文部分内容阅读
传统的文本分类中相似度的计算,是根据欧氏空间中向量之间夹角的余弦值来表征的,它根据余弦值的大小来反映文本之间的相互关系。该文则首先建立文本集与码字集之间的1-1对应关系,然后借用编码理论中汉明距离的概念,由汉明距离的计算公式,得到了一种全新的文本相似度的计算方法,与传统的方法相比较,它具有简便,快速等优点。
其他文献
晚期罗马帝国的文化困境金利安罗马帝国的兴衰问题,始终是发人深省的。罗马帝国不仅开创了西方历史上空前繁荣的局面,而且近代以来西方社会所进行的诸多重大尝试及所面临的问题
有源电力滤波器作为一种应用在供电系统中的谐波抑制装置,有着谐波抑制效果好,响应速度快,稳定可靠性高等优点。传统APF控制思想是针对畸变电流中的所有谐波进行补偿,然而电
利用西安市1951-2008年逐日气象数据,以Z指数方法定义西安市雨涝指数,结合大雨、暴雨等主要强降水雨涝事件发生频次变化特征,揭示出西安市近58年雨涝灾害时间序列变化特征以
催化湿式过氧化氢氧化技术,是一种专门针对高浓度难降解有机废水的处理技术。对该技术中使用的催化剂进行了分类评述,并详细讨论了非均相催化剂的研究状况,展望了其今后的发展方
标准是经济活动的技术依据,促进投资贸易便利化,是推进"一带一路"倡议的重要抓手。发达国家普遍将标准化上升到国家战略高度,以标准抢占经济科技竞争制高点。我国作为世界第
以氧化铝、少量无机粘接剂为主要原料,加入适量的有机粘结剂、分散剂(聚丙烯酸铵)和水,采用浸渍和喷涂两种工艺在氧化铝支撑体上镀膜,然后在高温下烧制成氧化铝平板陶瓷膜。
随着计算机和互联网技术的飞速发展,各种类型的数据呈爆炸式增长。如何在海量数据中进行准确有效地信息挖掘和知识获取,已成为当今社会亟待解决的重点问题。聚类分析作为数据
俄罗斯民族文化历史发展中最早的原创性文学作品是在接受宗教的影响下产生的,俄罗斯人姓氏是宗教对整个俄罗斯文化影响的一个缩影,分析俄罗斯文化现象中数字的语用内涵,对俄
灾难危急时刻的管理往往是出乎于原有的抗灾计划的。研究发现,成功的灾害管理主要来源于应急组织的作用,特别是当管理中存在着信息交流、职权行使和协调发展等方面的问题时更
随着沈阳市全面加快城乡统筹发展和全域城市化进程的加快,大批沈阳周边的农村青壮年劳动力涌入市里,农村出现了许多空巢老人。针对这样的背景情况下,本文以沈阳市农村为例,认