基于用户查询与样本间匹配度评估的分层抽样策略

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:hot8391
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据探索性分析场景下,用户倾向于借助抽样系统获取近似查询结果来换取更快的查询速度。现有的抽样系统通常假设用户的历史查询记录能很好地表征未来的查询情况,从而针对特定的查询特征生成特定的抽样策略。然而,在现实场景中,用户探索意图变化丰富,用户查询特征的稳定性假设通常无法得到保证。为解决上述问题,提出一种评估任意用户查询与样本间匹配度的方法。离线训练生成多份样本集,并在应对具体查询时自动选取最匹配样本集进行近似结果计算。离线样本集的生成是以在所有可能的用户查询上的预期匹配度损失总和最小作为训练目标。实验结果表
其他文献
据世界卫生组织统计,全球肥胖症患者达3.12亿人,其中儿童占2200万人,11亿人体重过重,17亿人应该减肥.肥胖症和体重超常早已不是发达国家的"专利",已遍及五大洲.也就是说,地球
近年来,我国青少年学生体质状况逐年下降,并呈现出逐年严峻的特点.针对这一现象,本文拟从现代生活方式的负面影响、应试教育的弊端、社会体育资源稀缺等三个方面进行分析,论
采用三轴磁强计测量地磁场矢量,与轨道演化和国际地磁场参考模型(IGRF)计算获得的地磁场矢量进行比较,获得姿态角度信息的方法适合体积小、重量轻、功耗低的皮卫星应用环境。地
近年来广州市把会展业作为未来发展的支柱产业培育,其强大的产业带动效应带动相关行业创造了巨大的经济效益,形成了具有一定影响力的大会展产业。本文围绕做大做强广州会展业
目的寻找终末期尿毒症并发神经精神症状的原因,提高终末期尿毒症的临床诊治水平。方法回顾性分析56例出现神经精神症状的终末期尿毒症患者临床资料,将其分为尿毒症脑病组(A)组,共3
功能性消化不良(FD)是临床上的常见病、多发病,随着人们生活方式、饮食结构的改变及社会压力的增加,其发病率逐年升高,极大影响了患者的生活质量及身心健康,并消耗了大量的医
长期以来,农副产品"小生产"与餐饮企业"大市场"之间的矛盾严重阻碍着我国农业现代化的步伐和餐饮行业的持续健康发展,而"农餐对接"这一新型的农产品流通模式有利于解决这一矛盾。餐
第二章新型白酒配方的设计第一节设计原则新型白酒在制作前与传统固态法白酒一样要先进行酒体设计(配方设计).酒体设计的原则可从下面几个方面来思考[5].1做好调查研究工作1.
为解决船舶自动识别系统(automatic identification system, AIS)数据挖掘不够充分,对航路辨识分析不够全面等问题,提出一种基于改进谱聚类算法的数据挖掘方式。利用Sliding
业内人士知道,欧盟的三网融合步入正常发展轨道是在2005年之后,在此之前,主要为融合扫清障碍,创造发展条件。2005年前后,我国也开始了三网融合的“试点”。