查询性能预测方法的性能评测研究

来源 :第30届中国数据库学术会议 | 被引量 : 0次 | 上传用户:cqwsly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的查询性能预测方法一般都是利用查询的特征、文档集合的特征以及结果列表的特征预测查询结果的平均精度(AP).一种性能预测方法与其他方法比较时,通常采用预测的AP和查询真实AP之间的皮尔森线性相关系数或是肯德尔等级相关系数来进行衡量.然而,这种简单比较方法往往不能准确评估预测方法的性能.深入探讨了查询性能预测方法性能评测中存在的问题,发现了影响比较公平性的4个因素:预测所基于的排序器、预测目标、评估指标以及实验的数据集合大小并通过定量实验证明:1)排序器的检索性能越好,预测方法的预测性能也越好;2)不同的预测目标会影响预测性能,衡量搜索引擎质量指标(DCG)比AP更容易预测;3)相关性评估指标受数据分布影响严重,在相同的数据分布下,比较两种预测方法才公平;4)实验中查询集合过小会使得比较结果冲突,影响比较结果的可信度本工作时查询性能预测方法的性能评测具有重要意义.
其他文献
脂肪醇作为重要原料之一,在生产表面活性剂、增塑剂、乳化剂和香精香料等精细化工行业具有广泛的应用,其工业Cu/ZnO催化剂易失活,使用寿命较短.工业氢气、脂肪酸甲酯前序制备工艺均可能带来胺化合物,影响催化剂的活性.本文在间歇釜中考察了月桂酸甲酯加氢制月桂醇体系中胺化合物对Cu/ZnO催化剂的催化活性影响,分别采用比表面积测定仪、XRD、ICP-AES、XPS和SEM对催化剂使用前后的物化结构进行了测
本文采用苯乙烯、马来酸酐、丙烯酸为原料,以三硫代碳酸二(α,α′-二甲基-α-乙酸)酯(BDATC)为链转移剂,通过RAFT聚合方法合成了以聚苯乙烯(PSt)为疏水嵌段、聚丙烯酸(PAA)为亲水嵌段、苯乙烯-马来酸酐共聚物交替(PSMA)为功能嵌段的对称三嵌段双亲性嵌段共聚物PSt-b-PSMA-b-PAA,采用核磁共振、红外光谱和差示扫描量热法确认所合成的PSt-b-PSMA-b-PAA的三嵌段
研究了二甲基二烯丙基氯化铵单体(DMDAAC)改性棉纤维的机理和所获改性纤维的杀菌性能.以DMDAAC单体为原料,BIS为交联剂,在棉纤维表面进行原位聚合.采用扎烘焙固化工艺,以浸泡洗脱、溶胀率和FTIR表征的方法对所获改性纤维的改性效果进行考核;以大肠杆菌为研究对象,采用定时暴露法,考察改性棉纤维的杀菌性能.结果表明:制备得到的DMDAAC单体原位交联聚合改性棉纤维的FTIR谱图中DMDAAC单
由于传统硝化方法在实际应用中消耗大、废酸难处理、转换率低,化学和区域选择性差等缺点,绿色硝化方法在近十年逐渐发展,其中离子液体在亲电取代反应中应用于绿色硝化反应也逐步成熟.氟硼二吡咯化物(BODIPY)荧光物质作为一种新型的荧光染料,其有很好的应用价值.特别是对OD坤Y的中心骨架进行官能化,可形成一系列衍生物用于环境监测和生物科学等领域研究.本文通过利用硝酸乙基铵/三氟甲磺酸酐(EAN/TFFA)
DNA associates strongly with cationic cosolutes: surfactant, lipids, proteins and polymers.The binding patterns for several systems are presented, illustrating the consequences of this binding in solu
会议
荧光染料作为功能性色素在科学技术的各个领域得到广泛应用,尤其在生命科学、临床医疗诊断、免疫分析检测等方面的研究在全世界备受瞩目.在众多的荧光染料中荧光素是一类被广泛应用的染料,这类染料具有大的摩尔消光系数、好的光稳定性、高的荧光量子产率等优点.荧光成像监测生物大分子在生命系统中最强大的技术之一,与在可见光区的吸收和发射的荧光传感器相比,近红外(NIR)范围内的染料在生命系统中的应用中是有利的生物成
The classical Echo state network (ESN)cannot fully exploit its advantages in some workwhich characterizestrong nonlinearity and high-order statistics.In order to overcome the shortcomings, this paper
目前,语料在各项研究中发挥着重要作用,现在的语科采集方法还不能满足需要.本文提出了一种新的语料采集方法,可以准确迅速的采集特定领域语料.通过修改Heritrix开源爬虫的组件,引入了APHash算法,解决爬虫队列平均分配问题,提高了采集效率,并通过加入URL判断条件,实现了特定领域语料的采集.对采集内容使用开用工具Tika进行解析,通过大规模采集,可以形成语料库,实现了特定语料的采集.
对静电的防护从前都是重技术轻管理,主要原因是懂技术的人不会管理,或管理人员不懂技术.本文首先介绍了制定方案,记录最敏感ESD器件等级,指派ESD控制方案经理或协调方面的管理,其次从元器件的ESD设计、系统级TLP等方面介绍了ESD防护不仅是防静电,更要设计提高元件和整机的抗ESD能力。
会议