主题搜索引擎的设计与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:Gzliao2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络己成为人们获取信息的一个重要途径,随着Web信息的日益增长,人们不得不花费大量的时间去搜索浏览自己需要的信息。搜索引擎随之成为人们最普遍使用的信息检索的工具。该工具涉及到信息检索、数据库、数据挖掘、人工智能、多线程处理、自然语言处理等多个领域的理论和技术,因而具有综合性和挑战性。但是,目前大多数的搜索引擎提供的服务还不能令用户满意,尤其是主题查询请求。因此,主题搜索引擎成为当前的一个重要研究课题。 本文针对目前搜索引擎存在的不足,充分研究了主题搜索引擎的发展现状,深入分析网页获取、索引生成、索引检索等搜索引擎核心技术的基础上,设计并实现了一种主题搜索引擎,结合网页重要性和内容相关性,给出了主题搜索引擎中几大模块的设计思路和实施策略,该搜索引擎使用多线程技术实现网页获取模块,通过词法分析、中文分词、索引词条选择和词典等技术建立索引数据库,并在专业词汇、查询扩展等方面对算法进行了改进和拓展。最后总结了主题搜索引擎系统的研究和开发经验,并指出了系统的应用前景以及下一步研究的方向。
其他文献
期刊
报纸
期刊
学位
期刊
期刊
期刊
期刊
报纸
期刊