一种面向WEB页面的标记聚类方法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:robinlaikankan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Web测试中现有Web页面聚类方法无法准确描述复杂页面结构、页面聚类准确度低、时间复杂度高的问题,分析了Web页面的DOM结构和节点属性,给出改进的树匹配算法衡量Web页面间相似度,并提出一种新的标记聚类方法实现Web页面聚类。通过实验对比验证所提出的方法能够有效处理复杂Web页面结构,且聚类准确度高,时间复杂度低,是一种高质量的Web页面聚类方法。
其他文献
目的:探讨分析对60例急性胃出血患者进行临床治疗的方法与疗效。方法 :选取2012年12月至2013年12月间我院收治的急性胃出血患者60例作为研究对象,将其随机分为实验组(30例)和
90年代是世纪之交的年代。还有五六年时间,就要跨入21世纪了。怎样进入21世纪,这是当今世界任何一个不甘落后、立志奋斗有为的国家和民族都在认真思考和谋划的重大战略问题。
探索了绿色化学实验教学体系,通过合理选择实验内容、利用先进的合成方法等措施,使化学实验教学对环境的污染降到最低,对培养具有绿色化学理念的优秀化学化工人才,提高人才培
经验模态分解(Empirical Mode Decomposition,EMD)是一种优秀的分析多分量非线性非平稳信号的自适应数据驱动方法,被广泛应用于时频分析领域。当信号中存在着间断的跳跃性变
2019年12月以来,新型冠状病毒肺炎疫情快速影响全球。新型冠状病毒肺炎患者是最主要传染源,人际间传播性强,飞沫传播是最主要传播途径。潜伏期多数在7 d内。常见临床表现有发
农业是国民经济的基础产业,在我国国民经济中,处于重要的战略地位,是一切经济工作之母。改革开放以来,我国农业取得了举世瞩目的成就。绝大部分地区解决了温饱问题,正在向小
介绍一种用于变电站电气设备绝缘在线监测的数据采集装置,合理的硬件设计使装置具有良好的性能。文中也对软件设计中的有关问题作了详细讨论。
农牧业生产事关民生,资源化处理农牧业废弃物是保证种养结合及养分循环必不可少的重要环节。实践表明,利用堆肥技术处理农牧废弃物不仅环保与安全,而且符合循环经济的要求,同
针对属性权重信息完全未知的多属性群组决策问题,提出了一种新的决策方法。先根据方案之间的最小偏差最大化思想建立决策模型,确定属性权重向量,并结合OWA算子确定综合决策矩
单核苷酸多态性(SNP)与复杂疾病之间的关联近来备受关注。SNP选择是在处理高维少样本的遗传数据时经常使用的方法,目的是从成千上万的SNP中选择出对遗传表型和疾病影响最大的