基于Apache Solr的分布式搜索引擎设计

来源 :中国计算机用户协会网络应用分会2010年网络新技术与应用研讨会 | 被引量 : 0次 | 上传用户:h_heart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
讨论了基于Apache Solr的分布式搜索引擎设计的若干问题,包括分布式方案的选择、中文分词、网络爬虫、排序和去重等。所有问题都是从实际工程的角度讨论,并不涉及搜索引擎的理论研究。
其他文献
随着我国软件与信息服务外包业的快速发展,软件测试服务市场已初步形成,急需大量高素质的软件测试人才。分析了软件与信息服务外包业人才需求及特点,针对软件测试应用性人才的知
会议
近年来,我国服务外包产业发展速度迅猛。服务外包产业以信息技术为依托,是人才智力密集型产业,该产业能否顺利发展,人才是关键。国际IT职业技能标准正在深刻影响着我国服务外包产
传统的基于关系数据库的数据查询功能无法给出与其在语义层上具有相关性的其它信息,从而导致查询质量和查询效率较为低下。针对此问题,基于可以为数据查询提供较好的语义支持的
针对Chord算法存在的缺点,提出双向去冗余查找的改进思想,双向查询Chord环,重构各节点finger table的表项组成,并消除冗余。改进后Chord环中节点的fingertable覆盖范围扩大了,定位
从科学的层次观出发,以决策问题的结构及建模过程的层次性为基本思想,讨论了校因网络建设过程管理的层次模型,为校园网络工程建设的可控可管提供了决策依据。
基于Hadoop的HDFS文件系统(Hadoop Distributed FileSystem)和MapReduce计算模型,研究和设计了高效实用的、面向结构工程海量科学实验数据的文件处理系统。该系统包含数据存储
在遥操作机器人微创手术中,由呼吸运动和心跳产生的组织周期性位移会给外科医生带来很大的干扰。尤其在进行一些高精确度的手术(缝合、插针等)时,外科医生必须很好的消除这种周
会议
介绍了如何建设基于多校区的开放式网络教学平台,探讨了优质教学资源的开发机制,并对多校区教学平台的管理模式进行了研究,以实现优质资源的有效共享以及网络教学的健康、可持续
针时分布式环境下集成性差、管理复杂、可靠性差等问题,提出和设计了分布式高可用软件框架。围绕该框架,介绍了业务、软件设计和实现技术。
随着网络技术的迅猛发展,XML已成为Internet上数据表示、存储和交换的标准。但由于XML文档的自描述特性,使得XML数据中存在大量冗余信息,因此如何压缩XML数据便成为研究的热点。
会议