基于特征加权的半监督聚类研究

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:minglinjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前在半监督聚类的研究中,尤其是当有类标信息的类的数量少于整个数据集的类的数量时,其聚类效果并不好。本文在现有半监督聚类技术的基础上,通过特征加权来提高同一类文档的相似性,从而得到更好的聚类效果。为了验证这一思想的有效性,实验不仅在单语言数据集上进行,还在中、英双语数据集上进行了只包含中文或英文类标时的聚类实验。实验结果表明,该方法体现出良好的性能。
其他文献
2005年11月~2006年10月,对广西桂林七星景区内的一群半野生猕猴Macacamulatta进行观察,采用瞬时扫描取样法收集有关活动时间分配数据,探讨影响猕猴活动时间分配的因素及适应其环
用α集团模型和少体理论方法研究了超核5ΛΗe,9ΛΒe,6ΛΛΗe和10ΛΛΒe的基态结合能.所采用的α-α势符合低能α-α散射实验及8Be的基态共振能量,Λ-α势是用Λ-N势及α
针对碎片拟合过程中存在大量由碎纸机形成的相似、相近甚至相同的碎片边缘,再好的边缘拟合算法也难以正确选择唯一候选碎片边缘的问题。提出了基于碎片中文字、图、表等内容信息在碎片边缘留下的内容特征,判定与目标碎片匹配候选碎片的思路。界定了特征点、特征向量等碎片内容特征的概念,给出特征点、特征向量的提取算法以及基于内容的碎片拟合算法。实验结果表明该算法正确、有效,为计算机自动合成碎片奠定了基础。
EASY% Ro法是一种能与现今Ro垂向分布达到最佳匹配的古地温梯度的反演热史分析法,涉及到重要环节是约束条件的最优化计算.计算发现,EASY% Ro得到的地温梯度史有一定的不确定性;
由清华大学承办的中国物理学会2006年秋季学术会议定于2006年9月15~17日在北京清华大学召开。中国物理学会秋季学术会议是由中国物理学会主办的年度学术会议,会议旨在为工作在
本文主要根据A.V.Arhangel’skii等人提出的相对拓扑性质的理论,给出次亚紧性质的相对定义.研究了相对次亚紧的一些性质及相对次亚紧与较强的相对覆盖性质之间的关系。
建立了复合材料加筋壁板屈曲和后屈曲有限元分析模型。该模型采用实体单元有效模拟筋条和蒙皮之间的连接。连接界面采用二次应力准则作为损伤起始判据、混合能量准则作为损伤
应用恒温微量热技术,对盐酸胍与牛血红蛋白在30℃水溶液中的结合作用及造成牛血红蛋白变性的过程进行研究,并根据简单结合模型,计算了它们之间的结合常数、结合自由能。用变性中
为研究弹药中自由空间对烤燃响应剧烈程度的影响,采用主装药为RDX的高能炸药压制6种不同直径的药柱,以(1±0.2)℃/min的升温速率进行了慢速烤燃试验。实验结果表明:当弹药内
稳定精度是光电稳定(像)平台的核心指标,从实验的角度来研究稳定精度的非线性影响因素的影响程度。为此建立了单轴稳定平台的物理模型,并建立了该平台的拉格朗日动力学方程。分