基于潜在语义空间维度特性的多层文档聚类

来源 :第三届全国搜索引擎和网上信息挖掘学术研讨会 | 被引量 : 0次 | 上传用户:yayayda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为实现文档在不同概念层次下的自动聚类,研究了潜在语义空间中维度的统计特性,发现对应大奇异值的维度描述了语义元素间的共性,对应小奇异值的维度描述了语义元素间的特性,呈现出潜在语义空间维度与概念粒度之间隐含的对应关系.基于这种认识,通过采用不同维度来实现文档在不同概念粒度下的聚类,并获得了很好的聚类准确率.另外,在基于潜在语义分析的文档聚类算法中,采用文档自检索矩阵的行向量,代替低维文档向量作为聚类对象,获得了更好的聚类准确率.
其他文献
我们建议一个复杂自适应地模拟长江流域经济发展和港口贸易的动力学模型,并且把我们对长江流域港口吞吐量的累计分布所作的实证统计研究结果作为检验模型模拟结果正确与否的
高血压是最常见的心血管病,也是其它心血管疾病发病、致残和死亡的重要危险因素之一.高血压患者的心血管病危险不仅取决于血压水平,还取决于同时存在的其它危险因素的数量和
文本被表示为向量空间模型后,是维数非常高的数据,对其进行维数约简是必要的.投影寻踪正是一种稳健的、非参数化的维数约简方法.提出了一种基于投影寻踪回归的文本自动分类模
会议
简要介绍了遗传算法的基本原理,探讨了在Matlab中的实现,并且通过具体实例对Matlab的遗传算法工具箱的用法作以简单说明。
对现有汽车减振器漏油失效的模式进行了分析研究,并针对各种可能造成减振器漏油的原因,从减振器设计与制造角度提出了一些改进方法,并将其应用于减振器的设计与制造方面,取得
PNF技术的开发历史是从对幼儿患者的应用开始的,知道这一点的人可能并不多.为此,本文介绍PNF基本技术和特殊技术、PNF治疗技术,并探讨PNF技术对幼儿患者的应用问题.
脑性瘫痪是由于出生后各种原因造成的脑损伤,表现出以运动障碍为主的残疾。同时常常伴有智力、语言、视觉和感知觉的障碍。本文介绍了脑瘫儿童的教育原则,阐述了脑瘫儿童的教育
目的:观察A型肉毒毒素(CBTX-A)联合康复治疗小儿痉挛型脑性瘫痪(脑瘫)的作用.方法:选择60例脑性瘫痪患儿,按随机原则将其分为两组:组Ⅰ,30例,单纯康复治疗组:组Ⅱ,30例,康复
2019年,景德镇国家陶瓷文化传承创新试验区成立,并确立了“两地一中心”的发展定位.“两地一中心”的发展定位为其发展带来巨大机遇.“两地一中心”发展定位下,环境陶艺在景
人工流产术为终止早期妊娠的门诊手术,该手术虽然简单,但稍有不慎,亦可出现并发症。现对我院门诊行人工流产术未见典型绒毛组织的34例进行回顾性分析,并将有关情况报告如下。