电力系统垂直搜索引擎的研究与设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:s3100401
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
某供电局电力信息一体化平台整体结构复杂、信息量大,综合了设备台帐、电力生产、电力设备采购、电力管理办公、变电运行日志、无功管理、停电计划管理、电力培训等多个系统,但目前却没有一个统一的搜索引擎为该电力信息一体化平台提供查询检索服务,无法跨系统查询,需人工到各个系统查询并分析原始信息。这使得在如此庞大的电力信息一体化平台查找信息极不方便,为电力部门的生产和管理工作带来不便。   为满足电力部门工作人员对于信息查找的需求,快速地为其提供准确的信息,减少查找工作时间,节省人力成本,本课题通过综合分析供电局实际业务情况和电力信息搜索需求,研究了当前垂直搜索引擎技术,在某供电局电力信息一体化平台上,设计并实现了电力系统垂直搜索引擎。本课题首先针对电力系统垂直搜索引擎的电力主题相关特性,构建了电力系统专业词库、电力专业同义词词典,提高了电力系统中的中文分词的准确性,同时也可以提高信息检索的准确性;接着设计和实现了电力系统垂直搜索引擎的电力信息采集模块,针对Shark-Search算法忽略页面中的URL子节点间的主题结构相关性的不足,提出了改进的Improved-Shark-Search算法,通过引进URL子节点间的主题相关度平均值作为影响因子从而提高算法的有效性;然后设计和实现了电力信息结构化抽取和索引模块,通过模板定义和模板分类匹配的方法对电力信息网页中的信息进行提取并结构化,有效地聚合了电力信息一体化平台中的数据,解决了数据分散化问题;最后创建电力信息索引,构建了一个电力系统垂直搜索引擎,从而为电力信息一体化平台提供电力主题垂直搜索服务。   通过使用电力信息一体化平台中的真实数据对电力系统垂直搜索引擎测试,并与通用搜索引擎比较,证明了电力系统垂直搜索引擎在电力部门的海量信息资源中能准确快速地搜索信息,并反馈结构化信息,具有较好的查全率和查准率。
其他文献
无线传感器网络的出现为很多领域带来了全新的应用方式。在环境监测领域,无线传感器网络使很多传统方法无法完成的监测任务成为可能。本文针对复杂河道中的环境监测问题提出了
声誉模型被视为是对等系统中解决文件污染,蠕虫,病毒等安全问题的有效机制,因此对等系统将声誉模型作为其协议设计不可或缺的一部分。然而,由于对等系统的开放性,它允许任何节点投
本文的研究来源于“国家科技基础条件平台应用服务支撑系统”项目下的“网络科技资源应用集成环境建设”子项目。元数据具有资源描述、发现、识别和资源管理等作用,针对我国科
综合媒体并不是一种具体的媒体形式,而是文本、动画、音频、视频、交互性信息的综合表达,是由多种媒体信息有机构成的动态可交互集合,支持按照指定的时间、空间布局同步呈现各种
车辆识别是智能交通管理系统的重要组成部分,同时也是数字图像处理技术、模式识别技术和计算机视觉等交叉学科研究的热门课题。目前,车辆识别系统主要是针对车牌进行识别,但
随着人工智能、大数据和物联网等新兴技术的迅猛发展和交叉融合,数据中心和超算中心的应用负载特征呈现愈发明显的多样化趋势,对互连网络的灵活性要求越来越高。现有的软件定义
在我国,近些年城镇车辆保有量迅速增加,汽车日益成为人们生活的一个重要组成部分。为了满足人们日益增长的通过网络获取信息的需求,车辆网络(简称VANET)应运而生。VANET网络为安
“面向863孵化器的综合技术服务平台”(简称:孵化器技术服务平台)是面向全国各863孵化器、软件技术服务机构和软件企业的综合技术服务平台。该平台采用开放的SOA技术架构,服务
中国教育与科研计算机网(CERNET)跨机构统一认证和资源共享基础设施(CARSI)项目旨在以跨机构联盟的形式搭建跨域应用资源和用户真实身份信息共享平台。跨域统一认证和资源共
随着半导体行业的飞速发展,集成电路规模的不断提高,系统芯片SoC(System on Chip)技术已逐渐成为集成电路技术的主流。由于信息产业的迅猛发展,信息化已经深入到国计民生的各个