中文搜索引擎关键技术的研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:akiro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机应用的普及以及共享网络信息资源需求的增强,人们越来越多的加入到互联网世界,应用的增加也迫使对信息检索有更高的要求。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务。 中文搜索引擎在实际应用中遇到了很多问题。由于网络信息资源的急速膨胀,中文搜索引擎技术尚未成熟,目前的中文搜索引擎已很难再提供完善的检索服务。首先它的数据更新慢,中英文支持不够理想。其次召回率和精度的平衡问题难以解决。这也使得搜索引擎优化成为一个新兴行业——完善搜索功能使之更加公平、公开、标准和人性化。 本文分析了搜索引擎国内外目前的研究现状,对中文搜索引擎的原理、主要技术及分类进行了论述,提出了中文搜索引擎技术的局限性以及产生局限性的原因。在对检索模型分析的基础上,对当前搜索引擎中的几大技术(知识库的建立、中文切分、自动文摘的生成、检索结果的排序、检索代理的实现)进行了详细的分析和研究。 目前的中文搜索引擎机制中,检索结果并未针对用户个性需求对信息优化重组,割裂了其需求上的相关性。为解决这一问题,在已有算法的基础上,本文提出了一种在Agent的基础上建立了兴趣模型,通过Agent的逐步学习,了解用户兴趣所在,并以此为依据对搜索引擎的检索结果进行过滤、合成和排序,对搜索结果进行了优化的技术,更好的满足了用户的需求。
其他文献
软件复用技术目前已成为实现软件工程化、工业化生产的首选途径,也是未来软件开发的发展方向。基于构件的软件复用技术可以大大减少软件开发所需的时间和费用,提高软件的灵活性
移动对象数据库是指对移动对象(如车辆、飞机、移动用户等)及其位置进行管理的数据库。在现实生活中,很多移动对象的运动往往限制在一定的拓扑网络中,我们称之为公路网。依靠传
自20世纪80年代以来,虚拟现实技术一直是信息领域研究、开发和应用的热点方向之一。它借助计算机构建出一个与现实环境十分逼真的虚拟环境,而且支持用户使用自然的技能亲身感
随着中国高等教育研究生招生规模的日益扩大,基于网络的研究生信息管理系统己经成为适应我国高等教育扩大规模,培养高等人才跨世纪工程的关键环节,也是高等教育得以顺利发展的基
近年来,随着企业对信息需求的不断提高,为增强自身的竞争力,企业逐步完善和发展自己的Intranet。由自己构建Intranet到外包Intranet即租用电信网构建VPN,以降低成本,提高效益
由于受限的网络带宽,状态更新过滤已经成为协同虚拟环境(CVE)中有效提高一致性和可扩展性的重要方法,本文主要研究CVE系统中各种过滤策略及其对任务性能的影响。为了对协同虚
移动自组网是指一组带有无线收发装置的移动节点组成的一个多跳的临时性的自治系统,网络中可以没有基站等固定的路由设施。当有线网络不可使用或者固定路由设施难以安装时,如
随着低能耗设备如RFID标签,传感器节点,智能卡,隐私权的保护等的发展,这些认为是数字信息社会的硬件和网络中的关键技术,然而这些具有有效资源的密码芯片在无线通信和嵌入式系统的
随着网络的飞速发展,其安全隐患越来越多,网络安全防护的重要性不言而喻,网络安全技术层出不穷。具有积极主动的入侵检测技术脱颖而出,成为保障网络安全的重要手段。生物免疫系统
水下无线传感器网络作为一项新兴的科研学科,近年来吸引了众多研究人员投身其中。同时,水下无线传感器网络的应用范围也越来越广,已在海洋监测、油气开发、地震预警和海军防