利用广义后缀树的最大相似度优先聚类方法

来源 :中国科技信息 | 被引量 : 0次 | 上传用户:kevendong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了利用后缀树模抽的最大相似度优先聚类方法,通过构造文档集的广义后缀树模型抽取短语作为特征项并映射到M维向量空间模型;计算文档间的相似度矩阵,对任意两个文档之间的相似度进行降序排列,优先合并具备最大相似度的文档对形成初始聚类;合并初始聚类得到最终聚类结果。
其他文献
本文报告6例颈动脉体瘤的彩色多普超声诊断经验,并经手术和病理证实。该法能有效显示肿瘤大小、形态及血供情况,易与颈部其它肿瘤鉴别。声像图诊断依据为:(1)位于颈劝脉分叉部的卵圆
目的:为了解上颌窦体积筛漏斗宽度与上颌窦炎的相关性,本文收集了263例鼻窦CT扫描资料,进行颌窦体积和筛斗宽度的测量。结果显示:患颌窦炎的上颌窦体积较正常小,筛漏斗的宽度较正常宽。
子宫血管畸形很少见于文献报道,合并妊娠者更为少见,我院发现一例,现报告如下:  患者,女,28岁.1年前出现月经量增多,但周期正常,4个月前因阴道大出血入某院治疗,B超检查子
笔者报告36例肺癌骨转移的CT表现,其中29例作X线平片检查。CT表现主要呈溶骨性骨破坏(69.5%),亦可呈成骨性(5.5%)或混合性(25%)骨破坏。CT扫描在发现和估价病变方面较X线平片敏
本文以吉图珲客运专线东兴隧道施工为例,介绍了严寒地区膨胀岩隧道防冻胀围岩径向注浆堵水、隧道衬砌保温以及CRD法施工技术,同时根据隧道结构和膨胀岩隧道特性对原设计CRD法进
在 tegafur 和人血清清蛋白( HSA )之间的相互作用上的系统的热力学性能的变化和在在 298.15 K 的系统的 HSA 的二级结构单位的变化被 Nano-Watt-Scale 等温的滴定热量测定(
凸轮轮廓建模是凸轮机构建模中的重点与难点。本文针对凸轮轮廓建模常用建模方法的优缺点,提出了综合利用MATLAB与UG软件,通过数据生成、采样点拟合、实体建模、装配及仿真,五个步骤完成凸轮机构的CAD/CAE的方法,并通过一个实例验证本方法正确性与有效性。
各种各样的新奇双金属氰化物(直接数字控制) 催化剂被修改中央金属(M) 成功地准备并且在 Zna 的氰化物离子(CN (?)) 之一[M (CN ) b ]6 号元素碳的化学符号建筑群。如此的修
三 2-oxoglutaric 酸类似物被综合。他们的相互作用禁止 withfactor 组织缺氧可诱导的因素(FIH ) 用最小公倍数被学习方法。结果证明 2-oxoglutaric 酸的恐水病的代用品在他