面向智能搜索的Web信息挖掘技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ljj35wmsj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的迅速发展为用户在网上发布和获取信息提供了极大的便利,但网络信息的迅速膨胀使得用户查找有价值的信息变得越来越困难。搜索引擎技术的发展在一定程度上为用户查找信息提供了便利。目前,搜索引擎正向智能化的方向发展,它的实现需要依赖一种新的网络技术——语义网技术。语义网技术在智能搜索方面的应用研究是目前网络搜索技术研究的热点,而且语义网与Web挖掘技术的结合已经形成了一个新的研究领域。本文对智能搜索的Web信息挖掘研究的一些相关技术进行了研究。首先,本论文简单介绍了课题研究的背景和意义,阐述了智能搜索的相关理论。对于语义网和Web挖掘的相关理论进行了总结和分析,并介绍了如何将这两种技术结合起来。其次,基于以上的研究工作,本文提出了一种语义智能搜索知识发现模型框架,并对各个子系统的功能进行了详细叙述。然后,对该模型主要功能模块RDF聚类模块实现的关键技术进行了研究,提出了一种基于语义距离的RDFMS数据层次聚类的改进算法,旨在改进语义化Web的查询推理效率和语义上的准确性以提高算法的效率,并进行了算法的实例验证。最后,本文对重用通用本体WordNet构建领域本体的方法进行了研究,实验结果表明,该方法可以重用WordNet的结构并从中获取领域知识,并半自动地快速构建领域本体。
其他文献
随着Internet的发展,Web系统凭借其开发、维护、费用等多方面的优势迅速发展起来,已经成为软件的发展趋势。在与软件体系结构,特别是动态软件体系结构的结合中,形成了一种可以不
当前,地理信息系统(GIS)无论在理论研究上还是在开发应用上都处于一个飞速发展的阶段,被广泛地应用于资源管理、环境监测、交通运输、城市规划等经济建设的各个领域。从图像
多信道无线数据广播是一种向大量用户传播数据的有效方法。这篇论文展示了无线数据广播系统基于字母序哈弗曼树(AH-Tree)索引机制的全局优化方案,这种优化方案能够有效地处理分
随着数字技术的进步,多媒体产业迅速发展,各种音频、视频等多媒体作品层出不穷。网络的普及使得这些作品的复制和传播变得十分的方便。然而技术在给人们带来便捷的同时也使得盗
CAD产品模型是厂家和设计者智慧和心血的结晶,它包含着有价值的知识产权,有着很大的经济价值。协同环境下产品模型的安全访问机制对于保护产品模型的可用性、完整性、机密性
随着网络带宽的增加、安全需要的增长和网络业务的不断发展,报文分类技术在网络设备和网络应用的作用逐渐凸显,应用日趋广泛。作为报文分类技术的核心,报文分类算法的本质是计算
体数据的拓扑分析和可视化是体数据的两个重要研究方向。近年来的研究将两者结合,利用数据的拓扑特征增强体绘制取得了非常好的效果。但传统的拓扑分析方法均是基于离散框架,
词汇知识库是自然语言处理系统不可或缺的组成部分,语言知识库的规模和质量在很大程度上决定了自然语言处理系统的成败。这已经成为自然语言处理研究人员和系统开发者的共识
随着信息技术、计算机产业以及互联网技术的迅速发展,嵌入式系统成为了当前IT产业最瞩目的焦点之一。Linux操作系统凭借开放源代码的特点在嵌入式中得到广泛的应用。很多的开
龙芯处理器是我国自主研发的高性能通用处理器,它兼容MIPS64指令集和一些专用指令,采用先进的结构设计技术,充分开发指令级并行性,已跻身世界先进通用处理器的行列。龙芯处理