基于编辑距离的XML文档结构聚类的改进算法

来源 :微计算机应用 | 被引量 : 0次 | 上传用户:dh184866884
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前XML文档结构聚类算法的一些不足,指出XML文档树中节点的重复和嵌套影响聚类的质量和效率。利用重复剪枝和嵌套剪枝简化XML文档树的表示,然后根据化简后的结构计算两棵XML文档树中的编辑距离,在此基础上得出两棵树整体的结构相似度量,按照层次聚类方法得到聚类结果。实验证明该算法有比较高的查全率和查准率,有效降低了时间复杂性,具有改进效果。
其他文献
<正>例1 患者女,49岁。临床诊断:甲状腺功能亢进症。动态心电图MV_5导联(图1上)示R_(1、3、5—7)为窦性搏动,P-R间期0.14s,QRS时间0.09s,T波直立,U波融合在T波降支的中下部,Q
静脉推注心律平终止21例次室上性心动过速并同时连续记录心电图,发现SVT终止前后心电图有4大类表现:①SVT之R-R间期不变,提示折返径路双向阻滞。②SVT之R-R间期终止前延长,提
以60例健康男性为对象,绘制了胸、背部98导联体表电位标测平均及高限((?)+2SD)心电 QRS 峰值图,提出了健康人 Q、R、S 峰值图的正常范围。生理性 Q 图以背部右上方为中心,并
分析了语音浏览器的概念和框架,以及语音输入、对话管理和响应生成整个口语对话过程的标记规范,重点说明了语音浏览器的核心标准VoiceXML的原理和工作特性,并描述了应用语音浏览器创建口语对话系统的整体方案。以此为基础,本文给出了语音浏览器在股票交易系统中的具体应用实例。通过语音浏览器平台,可以创建灵活性很强的混合主导对话模式的口语对话系统。
本文介绍了VRML及其一些高级应用,着重阐述了VRML的交互性,并给出了实例,提供了两种生成按钮的方法,对VRML和Java Applet结合生成按钮的方法做了详细的介绍,具有一定的实用性
<正> 问题提出:人群中有病人(带菌者)和健康人(易感染者),任何两人之间的接触是随机的,当健康人与病人接触时健康人是否被感染也是随机的,如果通过实际数据或经验掌握了这些
<正> 患者男性,28岁.因间歇性夜间脉搏缓慢、胸闷、胸痛约6年来院就诊.患者5年前曾因相同症状在当地就诊,心电图示高度房室传导阻滞,经住院观察数天无异常而出院.平素身体尚
回顾分析98例室性早搏病人的心电图及其它临床资料。结果发现无基础心脏病者和有基础心脏病组而心功能、左室腔大小或左室射血分数正常患者的室早 QRS 间期显著小于心功能不