定题搜索引擎Robot中若干关键技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:FlyinginSky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先研究了定题搜索Robot中的一些关键技术,包括Robot爬行的原理,Robot的基本组成,机器人排斥协议,以及经典定题搜索算法与网页相关度评价,并提出了定题搜索算法的改进方案。然后将元搜索引擎技术结合到定题搜索中,充分利用各综合型搜索引擎已有的成果,使得本文的搜索过程更加有目标性,更好地保证查全率与查准率。而为了提高系统的运行效率,充分利用资源与网络带宽,本文在系统中使用了分布式的体系结构;分布式结构也更好地保证了系统的健壮性。之后,从整体上对定题搜索Robot的整体结构,工作流程以及各个功能模块的作用进行了详细的介绍。在本文的最后对所做的工作进行了详细的总结,就论文未来的研究方向进行了展望。 本文所述的系统使用Microsoft 的Visual C++语言与MFC类库实现;实现过程中使用了多线程与分布式技术,分布式各模块之间通信使用的Socket技术实现;系统运行环境是Windows2000 Server操作系统。
其他文献
本文主要包括四部分内容。第一部分介绍了部分计值技术的理论基础和研究现状以及应用。第二部分介绍了Java虚拟机的体系结构和Java语言部分计值研究的发展现状。第三部分是本
该论文主要阐述了:基于网络的智能化计算机辅助教学是在现代建构主义理论的指导下,将计算机技术与教育、教学改革相结合,通过教学模式的智能化、网络化设计,衍生出的一种新的
本文对安全多方计算协议进行了研究,介绍并分析了现有的四类安全多方计算协议:“基于VSS 的安全多方计算协议”、“基于Mix-Match 的安全多方计算协议”、“基于OT 的安全多方
本文提出的网络管理方法,是在认真分析、比较当前各种网络性能、故障管理技术的优缺点后,针对故障管理中故障检测、过滤和定位中需要考虑的问题,吸收了各种现有技术的优秀思想而
远程教育以网络技术为支撑,具有时空自由、资源共享、系统开放、便于协作的优点,在发展远程教育的过程中人们深刻认识到,学习资源的共享性和复用性对远程教育的实用性和经济性具
本文讨论了RKIF规范的设计和推理引擎的实现。最终定义的RKIF实际上是一个默认封闭世界假设,并去掉了一些不常用的KIF语法特性的KIF子集。在此基础上,我们以Rete算法为核心,实现
计算机通信协议的开发难度随着复杂程度的增加而日益增大,潜在错误也越来越多,其中对协议规格说明理解的偏差是重要原因之一.因此需要对协议进行一致性测试,协议的一致性测试
目前,藏汉翻译在藏文化传播上具有十分重要的意义。人工翻译的方式无法满足藏汉翻译的需求,将现有的较为成熟的机器翻译技术应用于藏汉机器翻译十分必要。而集外词的出现,会严重
本文主要分为四个部分。第一部分是引言,主要讨论了在Java中引入泛型特性的原因,并概要介绍了泛型和JSR-14的一些背景知识。第二部分就主要研究了它的语法特性。该部分首先描述
差分隐私模型因其可证的隐私保障和有效实现方式而获得了广泛研究。粗略来说,如果统计查询结果与单个个体的数据的存在与否几乎没什么关系,则该查询满足差分隐私。本论文研究差