论文部分内容阅读
群智利用用户群体的智慧和资源,在诸多执行任务的场景中是一种有效的运作模式。然而由于给予用户的报酬很低,并且用户的专业领域、程度高低因人而异,用户群体提供的反馈信息通常是不可信的。为了提高群智系统中用户反馈数据的准确度,最近的研究提出了一种名为多标签分类的群智模型。针对用户群体可信度未知的场景,本文提出了基于BCH码的中心式多标签群智设计:我们为多标签群智设计了中心式的系统架构,并为每一个标签设计一个具有最大纠错能力的BCH码字,同时根据该设计的BCH码矩阵将用户群体的反馈数据映射到一个估计码字中,用以判定最后的近似标签。基于BCH码的多标签群智系统架构避免了用户群体和群智系统具有统一认知标准这一前提;群智平台中心式的处理在实际分配任务时不受到实际想象力的限制;基于BCH码的码矩阵设计不依赖于特定用户群体的可信度分布;对BCH码的设计进一步拉大标签之间的距离,提高了对用户反馈信息的容错能力;BCH码系统的生成方式同时也为码矩阵的生成提供了更低的计算复杂度。为了描述群智的背景和研究现状,本文首先简要介绍了群智系统及其典型应用场景。进一步我们介绍了群智系统的相关模型,包括多标签群智模型、用户群体模型和目前的最优推导算法。此外,基于该背景,我们引出基于编码理论的多标签群智模型,介绍其系统架构,并结合具体事例分析其动机及合理性。然而基于编码理论的多标签群智模型存在五个问题,其一为用户群体与群智系统必须具有统一的认知标准;其二为构造码矩阵计算量大,需要较大计算复杂度;其三为离线生成码矩阵时需要特定的用户群体的可信度分布,故而生成的码矩阵对于执行任务的可信度未知的用户群体不是最优解;其四为在实际场景中实例化特征会很大程度上受到人类想象力的限制;其五为在线动态分配子任务给用户群体时,用户的专业背景及资质和子任务之间不一定匹配。针对这些问题,我们提出了基于BCH码的中心式多标签群智模型BCH-CMCL,将处理用户群体反馈信息由分布式转化为中心式,并以BCH码设计码矩阵,代替基于编码理论的多标签群智模型中的码矩阵构造。多标签群智系统中心式的架构和处理方式取消了“用户群体与群智系统必须具有统一的认知标准”这一前提,避免了实际分配任务时受到人类有限想象力的限制。由于BCH码较大的汉明距离和系统的生成方式,BCH-CMCL不依赖于特定用户群体的可信度分布,可实现更大的容错能力和更低的码矩阵生成复杂度。具体来说,我们描述了BCH-CMCL的系统架构,从集合的角度,结合具体事例分析了该系统架构的优点,介绍了BCH码的构造和特性,给出了基于BCH码的码矩阵设计以及相应的算法实现,并简要总结了该码矩阵设计的优点。我们更进一步给出了BCH-CMCL的理论分析结果,其中包括,BCH-CMCL和基于编码理论的多标签群智模型在容错能力、汉明距离、码生成矩阵复杂度上的比较,以及BCH-CMCL平均错误率的上界及其充分条件和必要条件。理论分析表明,BCH-CMCL相比于基于编码理论的多标签群智模型,对可信度未知的用户群体具有更大的汉明距离和容错能力,且在离线生成码矩阵时具有更低计算复杂度;在用户群体的质量不算太低的情况下,BCH-CMCL可实现较高的准确度。为了验证BCH-CMCL性能的理论分析,我们基于matlab搭建了仿真平台并给出了一系列仿真结果,包括BCH-CMCL和基于编码理论的多标签群智模型的汉明距离、容错能力的比较,BCH-CMCL的理论和实际性能特性,以及多数表决、基于编码理论的多标签群智模型和BCH-CMCL的在准确度上的性能比较。仿真结果和理论分析相吻合,表明BCH-CMCL可从用户群体的反馈信息中更准确的近似出正确答案。