基于Bagging的XML文档集成聚类研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:ok695304259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将集成学习方法应用到XML文档聚类中来改进传统聚类算法的不足。提出一种标签与路径相结合的XML文档向量模型,基于这个模型,首先对原始文档集进行多次抽样,在新文档集上进行K均值聚类,然后对得到的聚类中心集合进行层次聚类。在人工数据集和真实数据集上的实验表明,该算法在召回率和精确率上优于K均值算法,并且增强了其鲁棒性。
其他文献
虚拟自然景物技术发展到今天,构造虚拟植物的模型已经很多,但多数都侧重于图形学方面,主要研究对象在某一时刻的形态。受达尔文生物进化论思想启发,借鉴生物界自然选择和进化机制
利用椭圆曲线上的双线性映射、门限多重签名和签名盲化技术,提出一个基于身份的门限多重盲签名方案,分析了方案的盲性以及安全性。该方案具有盲性、不可伪造性等安全特征,可
河南地处中原,宋之前,一直是中华民族政治、经济、文化的中心。中原文化是中华文化重要的组成部分,河南地方古籍文献是中原文化的载体,要了解和研究中原文化,要继承和发展中原文化
构建合乎伦理的企业文化在我国经济多元化期间显得尤为重要,这不仅是企业自身生存的需要,也是企业参与国际化竞争的必经之路。而研究企业伦理与企业文化之间的关系.不便是一个理
建立了每伴婴儿清火宝中DHA的酸性乙醚提取法,该方法优于目前应用广泛的有机溶剂直接抽提法和碱性乙醚提取法,适用于每伴婴儿清火宝中DHA的提取.
建立以X射线荧光光谱法测定进口高含量氯化钾的方法.采用粉末压片法对样品进行定性分析;采用溶液法对样品进行定量分析,工作曲线拟合满意,测量结果与标样标准值、未知试样化