【摘 要】
:
利用大众的力量和智慧来解决一些复杂问题的众包系统和应用获得飞速的发展,而大规模参与者提供的数据质量参差不齐,使得质量控制成为众包平台面临的一项巨大挑战。同伴/参与者互评(peer grading)作为众包技术的一个特殊应用,能够极大地改善参与者的提交质量,是质量控制的一种重要方式。但是,因为参与者缺乏认真评价的动力、受自身专业能力的限制或是恶意打低分等,导致了提供的评分不准确或是随意评分的情况。本
论文部分内容阅读
利用大众的力量和智慧来解决一些复杂问题的众包系统和应用获得飞速的发展,而大规模参与者提供的数据质量参差不齐,使得质量控制成为众包平台面临的一项巨大挑战。同伴/参与者互评(peer grading)作为众包技术的一个特殊应用,能够极大地改善参与者的提交质量,是质量控制的一种重要方式。但是,因为参与者缺乏认真评价的动力、受自身专业能力的限制或是恶意打低分等,导致了提供的评分不准确或是随意评分的情况。本文基于同伴互评,并将MOOCs作为典型的应用环境,设计并实现适用于解决开放型任务(例如文章写作或图形设计)的同伴互评方案,也就是基于参与者互评的数据质量控制方法,并且与现有的一些同伴互评方案进行对比。论文的主要贡献如下:(1)首先提出了一个教师辅助的的同伴互评方案,RankwithTA。不同于简单的聚合方法,RankwithTA方案执行一系列的迭代,每次迭代由两个更新步骤组成:(i)根据评价者给出的评分与被评价者推测出来的聚合成绩之间的差异更新评价者评分的可靠性(准确性);(ii)基于评价者的可靠性以加权的方式更新每个被评价者提交的质量(即被评价者的成绩)。此外,RankwithTA方案还利用外部校准,即让教师给出一部分学生的正确评分,用来提供评分准确性的依据。实验结果显示,RankwithTA的性能优于基线方案。(2)在RankwithTA方案中,是利用参与者的成绩来衡量其评分能力,这在实际中是不太准确的。针对这个问题,设计了一个半监督的同伴互评方案,SSPA。半监督是指,方案将教师给出少量的准确分数作为基本事实,用来校准聚合同伴评分的过程。该方案明显地区分了参与者的完成任务的专业能力和他评审其他人作业的评分能力,然后利用同伴给的评分的加权平均来推断每个学生的最终成绩,其中评分者的权重是他的评分能力。仿真结果表明,SSPA方案的性能优于基准方案,和RankwithTA方案相比准确性也得到了提高。(3)有效的聚合算法可以消除同伴互评中无意识的打分偏差,但是还存在着恶意和随意打分的情况。根据理论分析,适当的激励机制可以有效地鼓励参与者认真并诚实地评分。针对同伴互评的一个重要场景:根据学生的相互评估,选择一部分学生授予奖学金,提出了一个基于诚实评分的防策略的同伴选择方案,TSP。该方案中加入激励机制,利用额外奖励,鼓励学生努力评分并真实地报告分数,解决同伴互评中学生不愿意投入精力参与互评的问题。理论分析和仿真结果表明,TSP既能激发学生真实地报告自己的评分,又能以防策略性的方式选择最优秀的学生。
其他文献
在智能卡、智能门禁等广泛应用于公共交通、身份识别等重要领域的智能安全系统中,对芯片数据的输入输出、传输处理进行加解密,具有十分重要的意义。然而,实现加解密算法,必然带来芯片设计规模的增加和IP核的大量采用。目前,芯片功能的验证已经成为制约芯片设计的瓶颈。高效的验证是设计功能的正确、设计生产率提高的重要保障。本论文采用通用验证方法学UVM(Universal Verification Methodo
随着航天科学技术的不断发展,各国的宇宙深空探测工程相继展开,其中航天器自主导航技术一直是深空探测工程亟待解决的关键技术之一。X射线脉冲星导航(X-ray Pulsar-based Navigation,XPNAV)是一种新型的自主导航方式,能为航天器提供位置、时间和姿态等信息。由于XPNAV飞行试验需在外太空进行,风险大,成本极高,国内外相继开展了针对XPNAV的地面导航验证系统研究。目前,XPN
解放战争时期是中国共产党历史的重要组成部分,中国共产党逐渐由弱变强,战胜了比自身强大的国民党,取得了全国解放战争的胜利,建立了新中国。解放战争的胜利离不开中国共产党形象塑造,党通过实践路径、宣传路径和理论建设路径进行了党的多种良好形象塑造,获得了多数人的认可和支持,为解放战争的胜利创造了有利条件。为了更好的了解解放战争时期中国共产党形象塑造的内容,可以把解放战争分为三个阶段,每一阶段党进行了不同的
腈类化合物在药学界、化学界、自然界等领域中皆发挥着不可替代的作用。不论是具有药用价值的天然腈类化合物还是在材料中举足轻重的高聚物亦或是在有机合成中可发生多样变化
固井质量检测的主要目的是检测套管井中水泥环与套管和地层的胶结面质量,还包括井周介质状态与强度、水泥环结构、套管状态与居中等情况,对套管井的结构状况给出综合评价。套管井的质量决定了油气井的后续开发和生产寿命,因此固井质量评价具有重要意义。套管井超声成像仪结合了经典的脉冲回波技术和最新的挠曲波成像技术两种技术,对固井质量的评价更加全面、可靠。本文设计和实现了一种套管井超声成像仪数据采集与处理电路,主要
子女出柜对于大多数家庭而言是一个创伤性事件。很多研究使用悲伤作为一个中心隐喻来表现子女出柜之后的家庭遭遇,但很少关注父母所面临压力的差异,以及父母的应对策略。本文运用深度访谈法和网络民族志法的研究方法,从“出柜本构”模型出发,提出了父母接纳历程的三个阶段,并指出在这三个阶段中由于父母与子女的亲密关系模式不同(代际亲密关系与固定亲密关系),其接接纳策略也不同。从本构出柜模型的认知、关系和文化三个维度
随着自然科学的快速发展,人类在生物基因的研究方面,出现了丰富的多学科交叉科研成果,DNA序列可视化便是一个结合了生物学与计算机科学的研究方向。DNA序列可视化因其直观、简捷等优势帮助研究人员快速观察和分析,已成为当前基因序列研究中不可缺少的一部分,因此形成一套完整、简捷、可利用价值较高的可视化模型是当前DNA序列可视化领域的重中之重。然而目前的DNA序列可视化研究成果较少,并且已有的可视化模型仍然
钻杆作为石油钻探的重要部件,能够向钻头传递压力及扭矩。在整个工作过程中,钻杆不仅承受交变载荷、接触应力,而且还会受到泥浆里的腐蚀介质腐蚀,易产生缺陷,造成重大事故,带来不可估量的经济损失。为此,对钻杆实施无损检测具有重要意义。漏磁无损检测技术中,磁化作为实现检测的关键,对缺陷漏磁场的产生及磁场信号的分辨具有重要意义,同时也是检测信号的性能特性分析及检测装置的机械设计重要影响因素之一。根据不同的场合
随着《国家发展改革委关于做好水电工程先移民后建设有关工作的通知》(发改能源[2012]293号)的发布,以及国家对勘察设计行业提出的“着力改变平行承包模式,大力推进工程总承包模式”的政策导向,开始有大型水利水电勘察设计企业在水利水电移民安置工程中尝试推广应用总承包模式。DB模式(Design-Build,即设计-建造模式)作为总承包模式中的一种,将设计和施工一体化,在质量、投资、进度方面有显著优势
汞作为毒性较大的重金属之一,其污染具有不可生物降解性、隐蔽性、长期性以及在食物链中的积累和生物放大作用,会对环境产生不可逆的影响,对生物体造成严重的危害。微生物可以将环境中的有机汞和无机汞降解、转化为可挥发的零价汞,虽然不能将汞污染彻底消除,但可以有效降低其毒性及其对环境的不良影响。微生物修复法因其较低的成本,便捷的操作和不产生二次污染等优点在环境污染修复工作中被广泛应用,是目前解决环境污染问题最