一种基于改进粒子群优化的XML结构聚类方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:windFWF1992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对XML文档进行数据挖掘时,很多结构语义信息没有被充分考虑进来.为了更好地进行大规模文档集的挖掘,本文首先给出一个新的基于语义和支持度的XML结构模型对每个文档建模.然后根据该模型,提出基于改进粒子群优化的结构聚类方法.实验中,为了增加算法的实用性,将粒子群优化的思想与传统的K均值算法相结合,其优点是能够跳出局部极值.实验结果表明提出的方法在聚类准确性和收敛程度方面都优于传统基于划分的聚类算法.
其他文献
取死亡胎儿的食管,将其等分为上,中,下三段,对各段食管神经支配特点进行光镜和一般透射电镜观察。结果表明:肌间神经丛从上段食管下部开始出发,支配上段分管骨骼肌的神经纤维终末呈
基于各向异性扩散模型的图像盲恢复算法,其缺点在于速度难以得到显著地提升.为了加快图像恢复速度,同时尽可能提供令人满意的恢复结果.提出基于贝叶斯框架的图像盲恢复算法,首先引入调和模型作为原始图像和模糊的先验模型;然后,用伽马分布描述未知的参数;最后,利用变分近似的方法,以迭代的方式,交替地估计原始图像、模糊和参数的最优值.实验结果证明了该算法的有效性,与同类算法相比,可以得到更好的恢复结果;与基于各
针对分布式系统中自治实体的交互行为和实时约束行为动态变化的问题,提出了一个具有动态性、实时性的协同模型.在该模型中,利用关注点分离思想,从传统自治实体中分离出两类不
在文本关联分类研究中,训练样本特征词的分布情况对分类结果影响很大.即使是同一种关联分类算法,在不同的样本集上使用,分类效果也可能明显不同.为此,本文利用加权方法改善文本关联
用甘肃出土的177副、(男127副、女50例)354侧、1770根汉族成人掌骨的长度,前后径、横径和重量进行了测量,测量数据作了统计学处理,并作了男女、同侧、左右两侧的对比。结果表明:除第1、4掌骨少数项目
采用火焰原子吸收法测定了长治地区3-10个月120具正常胎尸肾腺内Cu,Zn,Fe,Mg,Cd,Mn的含量,结果经检验6种元素含量均随胎龄增长而减少。其中Cu,Zn差异非常显著,其余各值差异不显著。
国家科技领导小组成立暨第一次会议近日在中南海举行。国务院总理、国家科技领导小组组长李鹏主持会议并讲话。李鹏指出,要实现"九五"计划和2010年远景目标.必须依靠科技进步
故事梗概:20世纪70年代的西德,叛逆女子丽塔与恐怖主义组织的同伙持枪抢劫银行,将抢来的钱物施舍给乞丐.
针对多技能呼叫中心提出一种高效快速的人力需求计算模型:首先不考虑难以分析的路由策略,通过构造多面集来近似解空间,从而得到一个可快速求解的线性规划模型,然后以该解作为搜索
Efe提出的交叉立方体(crossed cube)是超立方体(hypercube)的一种变型,其某些性质优于超立方体,比如其直径几乎是超立方体的一半.在高性能的并行计算机系统中,信息是通过若干条结