基于时间序列的搜索引擎评估模型算法研究

被引量 : 0次 | 上传用户:wf1899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,搜索引擎作为人类获取信息的首要工具它的优劣直接决定了人们获取信息的准确性、速度和成本。因此,分析用户对搜索引擎的满意度一直是信息检索界的重要研究方向。本文以现代搜索技术中满意度及相关性等评估工作为基础,通过构建熵权模型及时间序列模型,分析引起搜索引擎满意度变化的主要因素。本文主要分为三大部分进行研究:首先,基于目前网页搜索评估中最重要的相关性评估和Session满意度分析两个主要部分,分析了两种评估的现状及存在的问题,并深入探讨了与本文相关的信息熵理论和时间序列模型。然后,确定分析满意度所需要的数据源——用户行为日志。对日志进行融合、对象重构、指标筛选、维度扁平化、扩展和多维度的拆分等操作,最终将处理后的数据存储到Infobright数据仓库中从而成为后续分析的数据基础。在此基础上,构造了熵权模型的判别矩阵,在已知结论的情况下逆向求解熵权,通过实验确定其可行性和合理性。在分析定位熵权模型的缺点后,设计了符合数据特点的时间序列模型,并构造出最终的满意度变化分析模型,实验分析了不同指标在Session满意度变化过程中的贡献。最后,设计并开发了基于时间序列的满意度变化分析系统,包括日志处理、计算熵权、计算满意度贡献、时间序列预测以及结论存储等5个模块。实际分析中该系统的结论为搜索引擎功能和服务的改进提供了一定的方向性建议,理论方面提出了一套简单易行、适合集群运算的分析满意度变化因素的算法。
其他文献
语言是人们在生产生活过程中产生和发展起来的一种社交工具,其功能就是沟通信息。语言禁忌现象普遍存在于中西方文化之中。本文从汉英禁忌语的共同点入手,比较"宗教类"、"死
从历史沿革看,越南社会主义经历了建国之初贫困潦倒、受苏联模式影响陷入停滞、受中国启发进行革新开放三个阶段。进入21世纪之后,越南社会主义事业获得了新的发展,公民社会
随着世界经济一体化和信息化时代的到来,企业之间的竞争上升为无形的品牌之间的竞争,企业只有不断提升自身的品牌价值,才有可能在竞争中占据一席之地。从提升品牌价值的渠道
目的探讨顽固性筛前动脉性鼻出血的治疗方法。方法内窥镜辅助下经眶路行筛前动脉结扎达到止血目的。结果患者鼻腔出血均有效控制,无并发症发生。结论内窥镜辅助下眶路行筛前动
本文针对当前飞机驾驶舱内导光板照明系统采用手动亮度调节方式即增加驾驶员负担,又不易根据驾驶舱光环境精准控制导光板亮度的问题,深入研究了导光板照明系统的自适应调光控
在中国现代文学史中,萧红的小说《呼兰河传》是一个颇显特别的文本,体现出一种特别的个体性,尤其是小说中那别类的散文化叙事风格,萧红确实用带有一种含泪的微笑回忆寂寞的小
分析了餐具盒塑料件的结构及设计了热流道注射模具,详细介绍了热流道注射模具浇注系统结构设计、尺寸计算、热流道板形式和热功率计算、热流道板线膨胀补偿计算及在模具设计
本文运用马克思主义的立场、观点和方法,从逻辑体系结构出发,对陈云干部选拔思想进行理论概括。对陈云干部选拔思想的研究,笔者认为一方面可以纪念陈云同志在中国革命和建设
对带内螺纹的塑料制品及其模具结构进行分析,采用自动卸螺纹和压缩空气二次顶出相结合的结构较紧凑的脱模机构。避免了推板、顶针或顶管的使用,从而实现了模具的轻量化,降低
微时代已经到来,语文教学需与时俱进,高度重视"微课"这一新事物。本文通过将其与传统课堂教学的比较,对其概念进行厘清,同时对微课在语文教学中的运用进行初步探讨。