基于独立分量的XML文档聚类方法

来源 :全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会 | 被引量 : 0次 | 上传用户:ansonliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML文档聚类可有效地压缩搜索空间,从而加速查询.本文提出一种新的基于独立分量的文档聚类方法,该方法能挖掘文档矩阵中潜在的、更加划分能力的属性,而且同时具有降维作用以减小计算量.首先利用层次路径序列进行特征提取,将文档矩阵映射到向量空间中,然后在独立分量所张成的新空间中进行聚类分析,实验结果表明该方法在准确性和扩展性上都明显优于传统的聚类方法.据我们所知,本文是最早将独立分量分析应用于XML文档聚类的.
其他文献
电磁搅拌技术(AL-EMS)是一项已被证实和广为采用的对熔铝炉和静置炉中铝液进行有效搅拌的技术。目前已在全世界安装了150多台铝电磁搅拌器。AL-EMS能够缩短熔炼时间、增加产
本文介绍了明泰铝业主机及相关设备现状,阐述了明泰(1+4)铝热轧机组的设备状况,以及投产数月来的运行情况。
介绍了对日本、韩国、瑞典等国一些铝加工企业访问考察中的所见所闻,以及在意大利罗马举行的“第五届铝2000国际技术研讨会议”的概况。
任务调度是一个NP-hard问题,而且是并行与分布式计算中一个必不可少的组成部分,特别是在网格计算环境中任务调度更加复杂.文中结合遗传算法GA和模拟退火算法SA的优点,提出了
本文指出当前电子政务系统数据交换中存在的问题,说明建立数据交换平台的迫切性.然后,分析了构建数据交换平台需要研究的内容,并给出了相应的技术路线.
为适应普适计算环境,计算机系统必须具有Context-Aware.本文通过探讨Context的确切含义和不同特征研究Context-Aware对对数据管理的要求和挑战;在此基础上参考当前的研究和可
领域本体具有概念结点繁多、结构层次复杂的特点,在映射时常常计算量大而且效率低下.本文提出了一种领域本体映射的剪枝算法,该算法从领域本体中概念结点相对抽象的部分开始
XML数据集包含冗余的数据,这不仅造成存贮空间的浪费,更为严重的是会引起对XML数据集的各种操作异常,包括插入异常、更新异常和删除异常等,破坏XML数据集的完整性和一致性.提
OWL是W3C最近提出的面向语义Web的知识表示标记语言,目前应用中还缺乏高效的推理工具.OWL DLP以描述逻辑程序为理论基础,既遵循了OWL的规范,又获得了逻辑程序领域中推理工具
近些年来,数据流查询处理技术在Web数据监控和分析领域得到了广泛的应用.数据流支持的Web数据管理往往涉及复杂的需求,在研究单个操作符算法的基础上,如何协调各个操作符的执