论文部分内容阅读
随着Web技术的发展与互联网的大规模普及,互联网逐渐成为一种人们日常生活中不可或缺的重要工具。由于身体的缺陷和硬件设备的限制,残疾人在利用互联网上的信息时存在着巨大的障碍。为了方便残疾人更有效地获取信息,提供信息的网站需要符合无障碍标准。基于众包的网站无障碍检测系统可以利用群体的智慧,让人数众多的检测人员来完成网站检测的任务,从而有效地发现对残疾人有障碍的网页和评估网站的无障碍程度,进而提升整个互联网的无障碍性。然而,由于检测人员具有不同的专业知识和生活背景,检测人员的检测质量并不能得到保证,而且不同检测人员在不同规则下的检测质量也不相同。如果随机地把检测任务分配给检测人员,将会导致检测人员的检测结果冲突甚至不正确,影响整个网站无障碍检测系统的实用性。 本文针对检测人员在不同检测规则下准确率的多样性,设计并实现了一种基于在线准确率预测的自适应任务分配方法,从而有效地完成任务分配,提升无障碍检测的质量。我们发现使用每一个无障碍检测任务的检测规则、主站地址以及检测页面,可以计算检测任务的之间相似度。首先把检测页面转换为标签树,然后使用树编辑距离算法计算检测页面的结构相似度。然后将检测任务的规则相似度,主站相似度以及页面结构相似度的组合起来作为检测任务的组合相似度。 基于检测任务之间的相似度,我们可以使用已完成任务的准确率预测未完成任务的准确率。预测的准确率需要让相似的任务之间的准确率相近,因此可以将准确率预测问题转换为一个最优化问题。在本文中,给出了该最优化问题的解析解以及为了优化时间性能的迭代解,它能够在检测人员完成任务之后在线地更新预测的准确率。 在已知预测的准确率之后,可以基于准确率进行任务分配。本文证明了最优的任务分配是一个NP完全问题,并提出了一个近似的贪心解法来进行任务分配。 最后,本文在无障碍检测系统中对上述的算法进行了实验验证。实验结果表明,本文提出的相似度度量算法、准确率预测算法以及任务分配方法具有有效性和实用性。