查询日志相关论文
随着产业互联网的高速发展,软件和互联网行业在近几年迎来了新的增长点。行业的发展加速了软件领域知识和技能的迭代,软件开发人员......
面对互联网上呈爆炸式增长的海量数据,搜索功能已成为网络应用中不可或缺的一环。用户在进行网络搜索时,会向搜索引擎提交一个“查询......
查询处理过程是Web搜索引擎中消耗时间最多的一个过程。缓存技术是一种用于优化查询处理过程的通用方法。而在缓存技术中,对缓存策......
基于关键字的搜索引擎是人们在互联网上搜索信息的重要方式,而互联网上大量的关系数据库则构成了DeepWeb的主要组成部分,因此面向......
随着互联网技术的快速发展,Internet上的信息也呈现爆炸式的增长;与此同时,网民数也在不断的增长,如何让用户在海量的信息中找到自......
随着Internet的快速发展,Web信息的迅速增加,人们越来越依赖使用搜索引擎来获取互联网上有用的信息。中文未登录词的识别和歧义的消......
领域术语识别是自然语言处理领域中的一个基本任务,在诸如本体构建、垂直搜索、文本分类、自动问答等现实任务中发挥着基础性的作用......
随着信息技术的发展,特别是互联网的迅速发展和广泛普及,导致了各种信息资源呈现爆炸式的增长,信息检索系统成为人们获取这些信息......
随着信息技术的飞速发展以及人们对信息需求的日益迫切,搜索引擎已成为人们在网上搜索相关信息的一个必不可少的工具。在使用搜索引......
随着互联网的快速普及,通过网络共享的信息资源正以指数级的速度递增。要从众多的网页中找到我们需要的信息,无疑像大海捞针一样困......
随着计算机和互联网的迅速普及,人类进入了信息时代,各种信息资源呈现出了爆炸式地增长。在大量的信息中帮助用户更加准确地找到他......
目前互联网上每天爆发着海量的信息,搜索引擎成了我们查找信息的最重要的工具。然而搜索引擎所提供的信息检索服务大多数仍然是大众......
云计算是一种新型的计算模式,可通过互联网以服务的方式提供动态可伸缩的虚拟化的计算资源。云平台的应用迁移是将企业或组织的信......
随着网络的快速普及,使用搜索引擎的用户规模正在逐渐增加,产生的日志信息呈现爆炸性的增长,海量搜索日志所带来的价值,引起了各个......
[目的/意义]了解、分析和识别用户学术搜索时所表达的信息需求是优化查询结果、提高学术搜索引擎用户体验的首要步骤,而用户进行学......
针对用户对搜索引擎查询结果满意度不高的问题,提出一种基于用户行为分析的查询意图识别方法来提高搜索引擎查询质量.将查询意图识......
用户查询意图是指用户在构建查询时,希望搜索引擎能够返回的信息.如果搜索引擎可以判断用户当前查询与之前输入的查询是否属于同一查......
对查询进行扩展的目的是找出查询中的潜在语义,确定用户意图,进而构造更适合于搜索引擎检索的查询语句,以提高检索的准确率.提出利......
查询扩展是信息检索中的一项重要技术。传统的局部分析查询扩展方法利用伪相关文档作为候选词集合,然而部分伪相关文档并不具有很......
大多数关于个性化信息检索的研究都是针对所有查询的,很少有研究试图回答哪些查询将受益于个性化信息检索。从大规模知识库中挖掘大......
以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法......
在分析搜索引擎查询日志的基础上,提出了一种基于线性回归的相关查询推荐方法。该方法考虑了查询串之间的多种关联关系,包括查询串会......
查询扩展是信息检索中的一个关键问题,查询扩展的有效性决定了检索系统的检索性能。大多数的查询扩展基于全局分析或者局部分析法,......
针对用户对搜索引擎查询结果满意度不高的问题,提出一种基于用户行为分析的查询意图识别方法来提高搜索引擎查询质量。将查询意图......
针对搜索引擎检索大规模数据时结果聚类的性能有限问题,提出一种查询日志辅助的改进K-Means算法。将传统的K-Means聚类扩展为多层......
通过分析用户的查询日志,模拟用户与搜索引擎之间的交互过程,提出一种基于查询加权的用户建模方法.首先,对查询日志进行会话分割;......
考虑到传统的基于日志的查询推荐算法受到数据稀疏问题的影响。本文在分析查询日志的基础上。构建查询词与点击URL之间的双向图,计......
数据立方体在许多多维数据的数据仓库的高速OLAP操作中扮演着重要的角色.但在许多高维的数据仓库的应用中,查询分析效率是个关键的问......
本文对"天网"搜索引擎的查询日志进行了数据挖掘,利用同一用户在短时间内输入的查询之间的潜在相关性,挖掘相关查询,在此基础上构......
在信息检索中,查询扩展一直被用来帮助提供更好的查询结果。作为一个热门话题,很多查询扩展方法被提出来,但其中大多数方法都是面......
通过对大规模查询日志进行挖掘分析进而提高检索的准确率一直是信息检索领域的热点问题。文章提出一种基于PMI-IR(逐点互信息方法)的......
网页分类可对海量网页进行分门别类,可应用于许多方面。现存的网页自动分类方法较多,其中常用的基于网页内容的方法由于网页内容的......
随着Internet的迅速发展,人们面对信息爆炸的现实。因此,需要根据用户的查询意图进行推荐。基于此,提出一种计算查询词相似度的方......
提出一种层次聚类算法,旨在对搜索引擎的查询日志数据进行聚类分析。算法基于搜狗实验室公开的查询日志数据,通过3次划分完成查询......
模式匹配被广泛应用于数据库相关领域中,例如数据集成、数据空间、DeepWeb、数据仓库、以及本体合并等。针对模式匹配的研究已有几......
随着科学技术的进步,特别是信息技术的不断发展以及互联网的普及,中文语言发生了巨大的变化。其中词汇作为语言中最活跃的部分,变......
随着互联网的迅猛发展,用户使用搜索引擎检索信息时产生的查询日志数据也越来越多。互联网企业急需一种方案能有效地从这些日志数......
【目的】利用搜索引擎日志数据对用户查询行为特征进行分析。【方法】采用分词、统计分析、聚类分析、可视化等方法,分别从用户的......
采用查询建议技术表现用户查询意图的多样化,并自动向用户提供多种选择,是当前搜索引擎普遍的做法。但当前的查询建议研究鲜有考虑......
查询会话检测的目的是确定用户为了满足某个特定需求而连续提交的相关查询。查询会话检测对于查询日志分析以及用户行为分析来说是......
通用搜索引擎的性质,决定了其不能满足特殊领域、特殊人群的精准化信息检索的需求。伴随着企业信息化快速发展,为企业量身定制企业级......
随着智能手机的广泛流行,移动互联网正不断改变着人们的生活方式,将用户从PC端带到了移动端,这一切都是因为手机应用程序(Application......
新闻中的关键词可以提高用户体验,帮助读者加速阅读和筛选感兴趣的内容。然而人工为新闻标注关键词需要消耗大量人力、物力和财力......
搜索引擎查询日志中的session(以下简称session)是指某特定用户为得到某个信息需求而在一段时间内的搜索行为的连续序列。Session......