大规模中文搜索日志中查询重复性分析

来源 :计算机工程 | 被引量 : 0次 | 上传用户:jplayer2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析大规模中文搜索日志中的查询重复性,通过对查询重复率和用户个体查询重复率等数据的统计发现:查询串的查询频率、文档的点击频率及用户查询频率均符合Zipf分布,查询重复率较高。查询历史越长,查询重复率越高。高查询频率用户的查询重复率较高。以上数据为中文搜索引擎的改进提供了有力的依据。
其他文献
薄膜在许多先进领域中都有广泛的应用。荷载下之薄膜,相对于其厚度而言,往往呈现出较大挠度值,因而其变形问题通常具有较强的非线性,使得其解析研究变得较为复杂、困难,并且其解答
提高实习护生整体素质是临床教学适应现代护理学发展而确立的教学目标,通过本科近10年大专,中专、职高各层次的临床教学,体会到应从以下几个方面实现教学目标,护士职业素质培养是
平面树是组合学与图论中的一种常见结构.它与Dyck路,Motzkin路及三角剖分等结构联系紧密,并且在统计学、数据结构及生物信息学等领域有着广泛应用.本文主要研究平面树中给定
随着科学技术不断发展,各种高新技术产品对微型零部件的需求量与日俱增,这给制造技术带来了一定的挑战。微塑性成形技术以其高效率等特点在微型零部件的批量制造过程中具有重要意义,然而微塑性成形技术由于加工工件尺度缩小所产生的尺度效应,需要采用新工艺方法及技术设备。在塑性成形过程中加载超声振动,能够降低工件材料成形抗力,减小工件与模具之间的界面摩擦力,一定程度上可以改善微塑性成形工艺过程。然而,当前超声振动
针对企业信息化建设过程中需要集成数据孤岛的问题,采用建设共享数据仓库的思想,利用完成ETL功能的DTS组件从遗留信息系统中整合数据,加载到一个集中的数据仓库中,满足当前对数据
在渐进网格算法的基础上,提出一种新的基于边优化的三角网格简化算法。在该方法重建出的多分辨率模型表面上,模型的细节层次呈连续分布,并且能跟随视点位置的变化发生动态变化。实验结果表明,该算法运算速度快,显示效果较好,能有效支持细节层次模型的表示。
针对网格中的服务实体只具有局部视野,常导致服务的可用性受到限制的缺陷,提出了一种基于D—S证据理论的工作流宏观自组织演化机制。该机制以网络中实体的交互行为作为有序演化
目的:研究单唾液酸四已糖神经节苷脂预处理对布比卡因神经毒性损伤大鼠脊髓的治疗作用,探讨布比卡因脊髓神经毒性对内质网应激相关凋亡因子caspase-12的影响,揭示内质网应激
目的探讨关节镜下复位并内固定治疗成人胫骨髁间嵴Ⅳ型骨折的手术方法及疗效.方法对11例成人Zaricznyj分类Ⅳ型的胫骨髁间嵴骨折患者施行关节镜下复位及内固定术.在关节镜直
动态心电图监测中,无痛性心肌缺血频繁发作的病人,是发生冠心病的高危人群.作者对冠心病患者进行24小时动态心电图监测,以探讨冠心病无症状心肌缺血的检出率;有症状与无症状