基于频繁结构的XML文档聚类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zhangqing1226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究基于频繁结构的XML文档聚类方法,其频繁结构包括频繁路径和频繁子树。首先介绍一种挖掘XML文档中所有嵌入频繁子树的算法SSTMiner,对SSTMiner算法进行修改,得到FrePathMiner算法和FreTreeMiner算法,分别用于挖掘XML文档中最大频繁路径和最大频繁子树,在此基础上,提出一种凝聚的层次聚类算法XMLCluster,分别以最大频繁路径和最大频繁子树作为XML文档的特征,对文档进行聚类。实验结果表明FrePathMiner算法和FreTreeMiner算法找到频繁结构的数量都比
其他文献
目的对比观察二级医院和三级医院治疗脑挫裂伤的临床效果。方法回顾分析二级医院重型脑挫裂伤78例的救治情况,并与同期三级医院脑挫裂伤50例的救治情况进行对比。结果三级医院
固井作业油气层的作业过程中,损害现象的发生,已经对很多地方的综合进步产生了不好的影响,因此必须在未来工作的进行中,加强损害机理的有效分析,从而选用正确的保护技术来应
毛泽东民族自信心的形成,一方面与时代紧密相联,另一方面与中国传统文化的教育和熏陶直接有关。确立马克思主义世界观以后,毛泽东在马克思主义民族观的指导下,民族自信心在内容和
目的调查2009—2012年住院患者铜绿假单胞菌临床分布及耐药性变迁,为临床合理使用抗生素提供参考依据。方法应用Microscan walkaway40全自动细菌鉴定仪进行细菌鉴定及药敏实
基于预测控制策略的多输入多输出(MIMO)控制器可以解决单通道变风量系统的控制问题,但在输入输出变量较多时,计算就变得非常复杂。在分析系统工作机理和系统动力学行为的基础上
做品牌就像“养孩子”,孩子在呵护、积累、沉淀中会慢慢长大,不论吃的好与坏,总会有回报,再给别人贴牌则是一条路走到黑
期刊
阿魏酸是桂皮酸的一种衍生物,其能抑制血小板凝聚和释放5-羟色胺,同时还能有效抑制血小板血栓素 A2(TXA2)生成,其存在形式多为脂类物质。此外,在白细胞减少疾病、心脑血管疾病的治
基于AWGN信道研究了对数域内T-TCM译码算法的表述与简化,重点分析了外信息在迭代译码过程中的产生与使用,结合雅可比对数式的特点详细给出分支度量计算的简化策略。仿真结果
瑞雪兆丰,晨曦璀璨。不忘新闻人的初心,牢记新闻人的使命,坚定新闻人的理想信念。《新闻文化建设》,一本全新的服务新闻战线同仁的杂志,今天面世了。《新闻文化建设》由中国