一种新的加权后缀树Web文档聚类方法

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:yanghao_711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Web文档的结构及其特征,提出了一种新的加权后缀树聚类方法WSTC。首先,根据Web文档的HTML标签,把文档划分为具备不同重要性等级的段,段划分成句子,句子分割为词。其次,用句子替代文档构造后缀树,把其重要性等级作为结构权融入后缀树的节点,形成文档集的加权后缀树模型。最后,在选择和合并基类过程中,综合利用节点包含的文档数、句子数、短语长度和结构权。仿真实验表明,WSTC算法比传统STC算法取得了更好的聚类效果。
其他文献
板料冲压成形过程中,系统的输入参数具有较大的随机性,并且系统优化通常需要满足多个目标。针对目前一些流行算法在精度和效率上存在的不足,提出了基于径向基函数响应面法的
真假目标识别一直是反导系统中地基雷达(GBR)的技术难点,而基于弹道导弹目标微动特性的雷达识别是近来研究的热点。微多普勒是目标微动特性的一种表征,基于弹头和诱饵微动特
虚拟装配的拟实性是影响该技术能否得到广泛应用的主要因素之一。基于物理属性的虚拟装配技术通过对物体的物理属性进行仿真和模拟,使得虚拟环境中的装配过程更接近于实际的
针对典型弹道体目标多普勒信号时频效应的分析,建立了连续波多普勒体制毫米波近程雷达的视频回波信号数学模型,并利用信号重排小波gabor变换方法对某靶机进行时频谱图仿真,仿
车载自组网是近年来无线网络以及智能交通领域的研究热点之一。在真实环境中测试和评估车载自组网的协议和应用有很大难度,因此利用车载自组网仿真工具进行研究就成为了一种
采用等维新信息和提高原始数据列光滑度的方法对灰色预测模型进行改进,具有预测更准确的效果,结合采用模糊神经网络控制的精确稳定性特点,提出一种改进的灰色预测的孵化模糊
指出了多分辨率作战仿真系统中存在的不同分辨率的聚合级实体之间以及聚合级实体和平台级实体之间的交互问题。针对这一问题,提出了通过指挥实体的指挥控制关系有机的连接不
基于智能互补融合的思想,将粗糙集理论与贝叶斯网络有机结合在一起,提出了一种超视距空战战术决策的新方法。利用粗糙集理论实现对专家知识的约简和空战态势信息集的压缩,提
对提出的一种新型6-PUS/UPU 5自由度并联机器人进行了动力学建模与仿真研究。首先利用凯恩方法对并联机器人进行动力学分析,然后Pro/E软件对并联机器人进行了建模,最后利用Ad
为了寻求更好的高动态GPS载波跟踪解决方案,设计了适于高动态环境的基于参数估计的载波跟踪环路,分析了高动态GPS载波跟踪系统模型,比较了EKF、UKF和PF三种滤波算法的参数估