论文部分内容阅读
本文针对某通信集团公司信息化建设中要求建立面向企业的统一信息搜索与分析平台进行研究,分析如何从企业内部海量数字信息中快速、精准地查找并定位需要的信息,提高企业用户的办公效率并提供个性化搜索服务的需求。权衡实施效率、成熟度等指标后,最终选定了J2EE框架下基于开源企业级搜索服务平台Solr的二次开发、大数据分析计算框架、语言处理等智能算法与构建高可用、可扩展的系统架构设计思想相结合的技术实现方式,设计支撑企业统一信息平台的企业级搜索分析平台解决方案。本方案中各种技术框架成熟度和企业实施成功率都很高,有Apache基金组织和多个知名社区的持续技术支持,技术实现难度不大且高效。本文主要介绍了搜索引擎对企业数据源的采集,对搜索引擎的一些核心技术进行了介绍与深入的分析;对企业级搜索框架Solr进行架构、代码、配置等方面的研究;最后设计并实现了一个基于SolrColud模式的满足企业个性化的多库搜索引擎。整个设计过程致力于提高管理维护的方便性和可扩展性,系统中分布式控制模块保证系统的负载均衡和高可用性,支持建立分布式的内部数据索引,实现对搜索服务器的集群化部署,且根据企业持续化的建设需求能够灵活扩展,减少企业相同或相似业务需求的重复性投资建设,能够缩短建设工期与投资成本。企业级统一信息搜索与分析平台作为企业办公网的基础设施,支撑集团总部及各直属单位和专业公司的统一信息化数据检索需求,后续将逐步向全国推广,支持企业各省公司及其所属单位的信息检索需求。本文解决了关于企业种类繁多且数据量庞大的多种业务数据源的采集,针对企业用户的个性化搜索需求完成了80%的设计建设工作,并为支撑企业不断扩大的信息化建设规模而设计的更加完善的个性化搜索方案提供有效的解决思路和实际验证。