【摘 要】
:
互联网中蕴含着大量的有价值信息,而搜索引擎是目前人们从互联网上检索信息的重要工具。传统的搜索引擎仅依靠关键字匹配为用户寻找相关的网页,并根据一定的算法进行排名呈献
论文部分内容阅读
互联网中蕴含着大量的有价值信息,而搜索引擎是目前人们从互联网上检索信息的重要工具。传统的搜索引擎仅依靠关键字匹配为用户寻找相关的网页,并根据一定的算法进行排名呈献给用户,并没有参考网页的语义信息。随着互联网技术的发展和人们精确搜索需求的增加,传统的搜索引擎已经不能够很好地适应这一需求的变化。为了解决传统搜索引擎存在的不足,知识搜索应运而生。知识搜索会分析用户的查询意图,并将相关的知识返回给用户,大大提高了搜索结果的准确程度和相关程度。由于自然语言处理的高耗时性并顾及到知识库增长带来的存储问题以及安全性,本文将知识搜索与分布式框架相结合,实现了一个包含工作流框架、分布式爬虫和分布式知识抽取模块的可灵活配置流程的分布式知识搜索系统,并对单机系统和分布式系统的效率进行了对比。在由三台机器组成的实验性分布式系统上进行的对比实验说明分布式知识抽取系统的效率比单机系统提高了近一倍,并且可以随着分布式集群的扩展继续提高。同时,分布式系统也能提供更好的安全性。
其他文献
随着社会信息化的发展以及安全保障的需求,实时视频监控技术得到了快速的发展和改进。在学校、城市交通、银行、医院等生活中的各个领域,实时视频监控技术都发挥出了重要作用
近几年来,随着数字录音设备的普及,数字录音大有取代以前模拟录音的趋势。各种音频处理算法和软件的广泛应用,使得一般的用户能轻易地对数字录音进行篡改而不留下痕迹,因此从录音
在传统电信产业中,产品由各式各样的硬件设备承载,而随着新技术和服务的创新加速,硬件设备的生命周期越来越短,服务提供商的网络运营日趋复杂,阻碍了业务创新。而随着互联网的快速
在互联网技术飞速发展的今天,微信、米聊等互联网应用给传统电信通信带来巨大的冲击;与此同时,互联网用户也渴望享受更加可靠、稳定、方便的电话网服务。为了很好的解决这个问
Java语言是一种面向对象的语言,广泛应用于服务器端、客户端以及移动计算等应用领域中,Java语言一个主要的特点是自动内存管理。自动内存管理也被称为垃圾收集(garbagecollecti
随着数据库技术日渐成熟,互联网堆积了大量公开的信息网络数据,如何利用这些数据进行分析,并从数据中提取出对于机构决策分析有用的信息已经成为了各机构决策管理以及决策分
在当今互联网时代,随着移动终端、互联网应用以及云计算模式的快速发展,数据中心已经成为社会基础设施。然而数据中心面临提高资源利用率和保障服务质量的矛盾,一方面通过在数据
随着空间信息技术发展与应用的深入,“数字城市”己成为当前城市信息化建设的主题。随着我国经济社会的发展,特别是改革开放以来,我国已取得了巨大的成就,同时面临新的机遇和挑战
在现今高度复杂的分布式计算环境中,网络应用服务系统往往被细化为许多服务子系统从而形成多层次的服务结构。这种结构极易拓展并且通用性很强,允许通过网络在不同机器上传递