论文部分内容阅读
从未经验证的数据中获得较高的质量的回答是一个经典问题。考虑了一种存在历史数据的二分类任务,利用历史任务训练出分类器后通过比对工人以及分类器给当前任务提供的回答估测分类器的准确率以融合数据来提高最终结果的准确度并且节约了劳动力。实验得出,在已知正负标签的先验概率时,充分利用先验概率进行的数据融合可以将分类器与工人的回答很好的融合并且获得更加准确的结果。实现了在没有正确的标签的情况下,训练分类器会根据不同的情况融合分类器与工人回答来提高最终结果的准确度的目标。