基于文档内位置关系的伪相关反馈方法

来源 :山东大学学报(理学版) | 被引量 : 0次 | 上传用户:woshi254211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于文档内位置关系的伪相关反馈框架LRoc(location-based Rocchio framework).该框架采用不同的核函数对候选词项在反馈文档中的位置进行建模,得到候选扩展词的位置重要度,并将其应用到经典的Rocchio模型中.该方法在选择和评估候选扩展词时,不仅考虑了词频,也考虑了词项位置的影响,有助于获取与查询更可能相关的扩展词.最后,在5种TREC数据集的实验结果表明:基于LRoc框架提出的3种模型(LRoc1、LRoc2和LRoc3)对比基线模型在MAP和P@20指标上具有显著提升.
其他文献
质子和中子是组成原子核的两种基本粒子,具有不同质子和中子数目的原子核构成了不同的核素.人们以质子数目和中子数目分别为纵轴和横轴,以每个核素对应位置作为标记的图被称
期刊
我们是谁?又从何而来?1871年,英国生物学家达尔文在《人类的起源与性的选择》一书中列举了多项证据,说明人类是由已经灭绝的古猿演化而来,自此,人类开启了科学研究人类起源的
期刊
伴随“美丽乡村”等政策落地,传统徽民居村落得到发展.街道景观是传统村落中的重要组成,为完善徽民居村落的整体研究,通过实地调研、文献搜集等方式,总结街道空间、街道内容
将邻域抗毁性该参数推广到顶点赋权图中,提出图的顶点赋权邻域粘连度概念.通过构造组合星图,建立数学规划模型,研究了几类图的顶点赋权邻域粘连度的极值问题.
期刊
对山东省珍稀濒危植物的研究发现,共有65科、123属和159种珍稀濒危植物,其中蕨类植物5科5属6种,裸子植物8科17属26种,被子植物52科101属127种.珍稀濒危植物在山东省各地市的
构建了使用潜热通量、显热通量、空气温度、总辐射、有效辐射、土壤温度、土壤体积含水量来模拟湿地生态系统CO2排放通量的3层BP神经网络.在确定BP神经网络拓扑结构之后,使用
文中提出了在短文本建模过程中引入词项与词项之间、词项与文档之间的全局结构关系来增强短文本的表示.由于有标签训练数据的缺乏,使得现有的全局结构关系建模方法,如TextGCN
利用事件报道描述内容高度相似的特点,提出了一种抽取式话题简短表示生成方法.把事件文档标题集中的标题作为处理对象,从不同的标题中抽取出保留原有语序的共性信息,并进一步
通过引入磁通变量实现电磁感应电流对膜电位的调制,建立一类新皮层神经元的四维神经元模型.基于单参数分岔图、双参数分岔图及其相应的最大李雅普诺夫指数图详细地分析该模型