基于学习排序添加辅助信息的标签排序方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:panzhengdang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学习排序是利用机器学习技术来对搜索结果进行排序的技术,在包括信息检索与数据挖掘等技术在内的众多应用领域中具有重大作用,因此近年来备受关注。学习排序假设每个培训实例都与一个可靠的标签相关联,并提供了一种优秀的自动化框架进行特征组合,这些组合可以查询依赖特征,如通过现存搜索引擎给文档赋予分数,也可以查询独立特征。本文调查了两种基本类型的辅助信息,并以此引入相应的学习算法中。研究使用的概率排序模型首先结合广义线性模型和Plackett-Luce(P-L)模型,用于处理基于实例的解决多分类标签的排序问题。目标是训练学习一种排序功能,排序功能通过训练并使用最大似然估计方法来估计标签排序,并迭代地训练排序功能,该功能可以在整套标签上产生完整的排序,并且在标签不完整的情况下依旧能提供有效的标签排序功能。随后排序功能通过两种辅助信息改进的ListMLE算法的新算法进行优化,该方法可以通过真实值标签和注释者专业知识程度来迭代地训练排序功能。此外,学习排序可以从众包标签中探索排序,改进后的算法在合成的以及实际的数据上都经过了测试,结果显示新的方法明显优于平均方法和现有众包回归方法。而对于拥有数据庞大的标签数据集将采用top-k技术,通过对全排序以及利用top-k技术进行排序的对比验证,使用top-k技术进行排序学习在时间效率上是有帮助的,并且结果与具有真实值的全排序标签的学习结果相当。
其他文献
<正>世界卫生组织(WHO)发布的《全球癌症报告2014》指出,2012年全球共新增癌症病例1400万,820万人死亡。全球癌症病例将呈现迅猛增长态势,到2035年将达到2400万人。来自中国
会议
新的经济社会背景下,建筑行业面临良好的发展机遇,在行业规模不断扩大的同时,如何加强安全管理工作,成为从业人员的研究重点。本文首先指出建筑安全标准化管理的特点,然后介
<正>财税改革是国家改变经济增长方式,提高预算的透明度和法制化程度,改善收入分配,激发企业活力的有效手段,是事关经济民生的重大课题。在今年的全国两会上,财税改革成为备
随着社会经济的逐渐进步发展,人们生活质量水平逐步提高,人们对日常居住与环境要求逐渐提高,建筑行业在具有广阔发展前景的情况下,需要面临更加巨大的挑战。为了提高建筑质量
视觉干扰会影响用户时信息的正确判断,阻碍用户浏览网页体验度的提升,降低信息传达的效率减少网页界面视觉干扰应明确页面信息的主次关系.恰当地应用分类识别手法,合理地利用信息
精英俘获是导致扶贫资源瞄准偏离的重要原因,在各国贫困治理中引发了诸多问题。国外对精英俘获的研究开始得较早,国内研究主要关注贫困治理领域。从精英俘获的现象、产生机制
继多元化公司存在“多元化折价”这一现象被Wernerfelt and Montgomery(1988),Lang and Stulz(1994),Berger and Ofek(1995)等学者研究发现后,众多的财务金融学者展开了大量
目的:由于关节软骨自身无血管淋巴管及神经分布,损伤后很难自身修复。如何处理膝关节软骨全层损伤是骨科领域的一大难题。微骨折技术(microfracture,MF)通过刺激未分化的骨髓间充质干细胞分化为软骨细胞,最终修复软骨缺损;富血小板血浆(platelet rich plasma,PRP)通过浓集的生长因子促进细胞活化、增殖等参与损伤组织的愈合。由于两者可以提供类似组织工程的种子细胞及生长因子,而
《三首前奏曲》是张帅最具代表性的作品之一,它巧妙的将中国本土的音乐素材与西方创作技法进行融合,是我国现当代钢琴作品中创作的典范,在众多中国钢琴作品的今天仍独树一帜
本文介绍了国家标准《绿色建筑评价标准》GB/T50378-2019编制工作的形势背景和基本情况,阐释了该标准重新构建评价指标体系、丰富绿色建筑内涵、更新绿色建筑术语、调整评价