多标记学习算法及其在商品评价打分中应用研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:achiao172
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的监督学习框架中,每个示例隶属于一个标记。在现实生活中,一个示例可能并不仅仅只被一个标记描述,而是同时隶属于多个标记。例如,一篇文档可能同时属于多个预先定义的主题,一张图片可能同时包含多个物体,一个基因可能同时拥有多种功能等。多标记学习是研究这类标记多义性问题的一种范式。然而,多标记学习问题不能解决诸如标记描述程度等问题,标记分布学习可以用来更加直接地解决这类标记多义性问题。从理论上说,标记分布学习是多标记范式的拓展,并且拥有更多的使用场景。如何充分利用并挖掘标记之间的相关性是多标记学习和标记分布学习的核心内容。基于此,本文主要研究多标记学习和标记分布学习范式中标记之间的相关性,主要研究内容如下:第一,基于关联规则的多标记学习算法。在多标记范式中,如果忽略各个标记间的关系,将多标记问题转化为多个单标记问题,会损失较多的标记关系信息导致分类效果不会太好。针对这一问题,本文利用关联规则算法挖掘标记之间的关联性,再利用得出的关联规则对多标记的数据集进行修改,更新多标记数据的标记分布,在此基础上使用现有分类算法进行分类。最后考虑到实际情况下,标记间的相关性只存在于部分子数据集中,进而考虑样本间的关联性,从而能够更加合理地修正数据,达到更好的分类效果。通过实验说明所提算法在处理多标记学习问题中的有效性。第二,基于标记相关性的标记分布学习算法。目前处理标记多义性的文献主要从两方面考虑标记之间的相关性,一是各个标记之间的相关性有先验知识,二是构建不同的模型计算各个标记之间的相关性。遗憾的是,上述算法大部分被应用于多标记范式中,在标记分布学习范式中应用较少。针对此问题,本文提出基于标记相关性的标记分布学习算法,将标记集合中的任意两个标记的距离利用参数矩阵中对应列之间的距离来替代,对现有的标记分布学习的模型进行改进,并使用L-BFGS算法进行优化。实验结果显示所提算法能够取得良好的效果。第三,基于多标记学习算法的商品评价打分应用。商品评价打分是在推荐系统的背景下被广泛研究的主题,这类问题是特定的用户对商品进行评分,系统进行预测并将高分的商品推荐给用户。本文将多标记学习算法应用于商品评价打分中,并与常用的几种标记分布学习算法和多标记学习算法进行实验对比,结果表明本文的方法在商品评价打分中具有更高的分类准确性,进一步说明本文所提算法的有效性,并且能够拓展多标记学习算法在实际问题中的应用。
其他文献
NetFPGA是一种可重用的、模块化程度高的开放性硬件平台,可以根据需要实现多种网络应用。详细介绍在NetFPGA平台上,使用硬件实现模块化路由器的方法,设计实施了一系列实验对N
<正>胡颓子(Elaeagnus pungens),长江以南各处山地都有野生,寒冬腊月,依旧满树叶子,柔批而下的枝条上还挂满了一颗颗长圆的小果子。它的叶片革质,狭长而尖,叶缘卷曲如波,绿色
期刊
市场竞争的加剧,营销领域出现了大量道德失范现象,不仅损害广大消费者的利益和社会的长远利益,也影响了企业的生存和发展,使企业产生信用危机。本文针对企业在营销过程中存在
融资融券是中国资本市场推出的一项重大制度创新,是促进中国资本市场发展的有效措施,是建立现代多层次证券市场的基础,有利于完善市场运行机制和证券市场制度性建设。由于中
为了进一步了解靖宇矿泉水中特征元素Sr2+、SiO2的形成过程中CO2所起的作用,以靖宇地区白浆泉和九龙泉的玄武岩为样本进行CO2影响实验和水解浸泡对照实验,研究CO2对Sr2+、SiO
提出一种基于行为分析的用户兴趣建模方法,计算用户短期兴趣和长期兴趣,以满足流媒体服务中的个性化需求,提高服务的效率。该方法在综合分析用户历史行为的基础上,考虑了不同
聚氯乙烯(PVC)防火卷材是塑料防水卷材中的一种,是高分子防水卷材中另一重要类别。其低温柔性好,延伸率大,因而适应冷热伸缩而不会开裂,力学性能好,抗拉强度、抗撕裂强度、耐
随着水利工程建设规模的不断扩大,其工程测量问题变得越来越重要。进行有效的工程测量对于工程建设的质量以及安全具有非常重要的作用。随着科学技术的不断发展,GPS技术因其
根据计算机网络的特点及网络安全涉及的因素,建立计算机网络安全评价的层次结构模型,运用基于三角模糊数的模糊层次分析法实现对网络安全的综合量化评价。实例的计算结果表明
本文通过分析我国地理标志产品体制中存在的管理制度混乱、立法冲突等问题,提出应当理顺管理体制,消除立法冲突,强化行业协会作用等建议,以完善我国的地理标志产品保护制度,