论文部分内容阅读
传统的回归方法假设一个样本只有一个回归目标。然而在大量的回归场景中,一个样本通常具有多个事物信息,对应多个回归目标。传统单目标回归方法不能准确、有效的表达样本的复杂信息。多目标回归是一种针对同时具有多个回归目标的数据样本的回归方法。因此,多目标回归自然的成为了解决多信息数据回归问题的重要手段和方法。在多目标回归中,一个样本同时隶属于多个目标,也能够更好的表现事物信息的多样性。近年来,多目标回归在计算机视觉和医学图像分析等多个领域得到了广泛关注,在现实世界中也具有越来越重要的潜在应用价值。尽管多目标回归的发展日新月异,但目前存在的多目标回归方法都是基于一个相同的输入(特征)空间来预测所有的目标,但不同的目标可能拥有不同的关于它自身独特特点的特征,因此这些方法可能只是次优的效果。所以,本文提出使用目标特定特征来预测不同的回归目标。同时,该方法可以解决多目标回归领域现存的两个重要挑战:1)如何挖掘目标之间的关联性;2)如何处理复杂的输入输出关系。针对上述问题,本文的主要研究内容可以分为以下三个方面:1.多目标回归的数据集同时具有多个回归目标。为了有效的挖掘目标之间的相关性,提升算法的性能。本文采用一种层次聚类方法,相似特点的样本会被分配到相同的叶子节点上,从而达到挖掘目标之间相关性的目的。2.为了有效的处理复杂的输入输出关系,本文提出一种基于目标特定特征的多目标回归方法。该方法使用分类回归树为每个目标计算一个相似度依赖矩阵,然后通过相应的相似度依赖矩阵进行聚类操作为每个目标提取恰当的、有区别力的特征。3.在信息技术高度发达的当今社会,电子商务将传统的商务流程电子化、数字化,一方面以电子流代替了实物流,可以大量减少人力、物力等方面的支出,降低成本,提高效率。与此同时,产生了大量的数据,合理利用数据信息,挖掘信息内部存在的价值,可以提高对事物的认知和了解,进一步优化资源配置,提高经济和社会效益。为了将多目标回归应用到现实工程中,本文将基于目标特定特征的多目标回归方法应用到来自阿里巴巴IJCAI17的竞赛数据集上,验证模型的稳定性。该方法通过利用每个目标的恰当的、有区别力的特征和目标之间的相关性来提升算法的性能。为了验证本文提出的多目标回归方法的有效性,我们在18个数据上进行了实验,实验结果表明该方法的实验效果远远超过目前流行的多目标回归方法。同时,为了验证该方法在实际应用中的效果,我们在一个来自阿里巴巴的现实工程应用上进行实验,也取得不错的效果。