基于Hadoop的机械故障诊断资源分布式信息检索系统的设计与实现

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:aids1324170
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索是从文档集合中返回满足用户需求的相关信息的过程。而搜索引擎是信息检索的一项成功应用,为用户提供快速、准确、全面、时新的海量Web信息导航服务。随着人们对信息在精度、深度和广度上的需求提高,搜索引擎将向精细化、个性化方向发展。当前搜索引擎的研究热点是垂直搜索、社交搜索和移动搜索。本文结合国家自然科学基金项目“基于知识网格的机械故障智能诊断系统的原理与方法研究”与目前互联网和搜索引擎发展的现状、热点,主要研究以下内容:(1)研究了信息检索和搜索引擎的发展现状,机械故障诊断知识管理的现状。研究了网页采集、网页内容分析、索引模块和查询接口等搜索引擎的体系结构和组成;信息检索系统中布尔模型、向量空间模型和概率模型等的定义、主要思想和优缺点;分布式信息检索的架构和分布式信息检索过程。(2)研究了Nutch的工作流程及Nutch的中文分词原理;Hadoop分布计算框架,HDFS的架构和MapReduce的计算流程。提出了基于Hadoop的机械故障诊断资源分布式信息检索系统的模型。(3)利用元搜索的思想设计了针对百度和谷歌的搜索结果获得机械故障诊断资源链接的程序,以插件的方式利用Paoding中文分词组件对系统的中文分词效果作改进,实现了对机械故障诊断资源的垂直搜索功能。实验结果表明,本文实现的系统能实现机械故障诊断资源的搜索,查准率比较好。
其他文献
该文以太钢1650m高炉扩容大修工程基础自动化系统为实践基础,对当今流行的现场总线技术和工业以太网技术从工程应用的角度进行了较为详细的阐述,主要侧重于现场总线通讯技术.
该文紧紧抓住集成化和智能化这两大网络安全技术的发展趋势,以Petri网和谓词逻辑理论为基础,不仅对网络安全领域的若干重要问题进行了分析和讨论,而且实现 了一个集成的可伸
近向年来,人们开始引入采用六色或六色以上油墨的专色印制系统以提高印刷品的颜色表征能力.这些系统有效的扩大了印制范围,提高了印刷质量.但油墨数目的增加,使印制设备的表
自从进入九十年代以来,世界步入了信息时代。人们对信息的需求也呈现出多样化、专业化的趋势。对各种获取信息的工具也提出了更高的要求,要求既要快速、准确、实时、方便地获取
随着计算机的不断普及与推广,数据库系统已成为日常生活不可或缺的组成部分。长期的应用给各大小企事业积累了大量的信息资料。如何有效地、综合地、有组织地管理和利用这些资
该文首先从研究柔性物体的基本问题入手,在深入研究图形学、有限单元法、刚体动力学的基础上,提出了描述柔性物体的一个有效模型:粒子——弹性系统.该模型运用物理技术对柔性
该文从存储系统的系统结构、操作系统的选择、调度策略、性能评测等方面,对磁盘阵列结构进行了深入的研究,主要内容包括:磁盘阵列结构的理论分析及其实现。
学位
在对网络的理论分析获得模拟试验验证的基础上,该文将ICBP网络模型应用于时间序列预测中.在混沌时间序列、多维差分时间序列和水资源利用量的预测的对比实验中,该模型在需较
对人类视觉的研究,以及利用计算机进行图像处理与理解在信息住处中有非常重大的意义.随着成像技术应用的不断扩大,对海量的数字图像信息如何进行管理以及如何从中提取特定的