语音智能助手的评测框架

来源 :清华大学 | 被引量 : 0次 | 上传用户:guojunaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音智能助手是指通过自然语言交互为用户提供服务的智能助手。本论文通过扩展评测指标、建立评测准则、设计并验证评测工具,建立了语音智能助手的评测框架。评测指标是评测质量的重要评估,本论文将评测指标从传统的客观绩效和主观评价,扩展到用户的认知过程,并比较了三种出声思考方法(回溯式、传统和交互式出声思考)在语音智能助手评测中获取认知过程的差异;评测准则是验证设计要素的重要依据,本论文提出了针对用户年龄分级为语音智能助手分级的准则,包括内容标签、交互行为和智能伦理三个维度,并在三种交互方式下(文本、语音及混合交互)验证了该准则;评测工具是提高成本效益的工具,本论文采用以用户为中心的设计流程,设计了语音智能助手分级工具VIARS(即Voice Intelligent Agent Rating System),并针对用户的经验差异和VIARS建议类型差异,验证了VIARS在不同指标评测中的可用性。研究结果表明:对于认知过程的获取,回溯式、传统、交互式出声思考方法各有优点,分别适合获取用户体验和原因解释类型文本、建议和预测类型文本、问题表述和建议类型文本;且回溯式和传统出声思考方法都可以获取更多的认知过程数据;评测时应根据具体的认知过程的收集目的选择对应的出声思考方法。对于分级准则,三个维度的不同指标水平均影响分级结果,准则的有效性均得到验证;且评测中混合交互方式会导致分级结果趋于宽松。基于该分级准则的VIARS设计,包含对话生成、语音转录、内容分析、结果展示和过程记录五个模块,并允许用户具有修改决策的控制权。对VIARS的可用性验证结果表明,专家分级结果具有更高的一致性,普通用户分级结果对VIARS具有强烈的依赖性;VIARS更适合评测规则型指标,而在评测经验型指标时应该将决策权交给专家;并且,在专家使用VIARS时,VIARS应多提供标准型建议而避免防御型建议。至此,本论文从评测指标(认知过程)、评测准则(分级准则)、评测工具(VIARS)三个方向,完成了对语音智能助手的评测框架建立,为未来的语音智能助手评测工作提供了理论参考。
其他文献
作为自动化生产线必不可少的设备,上料机是否性能稳定、工作效率高会直接影响工厂的生产效率。本文在对玻璃纤维无纺布分切作业流程进行研究和分析的基础上,设计灵感来自于旋
本文介绍了粘土矿物在废水处理、固体废物处理、核废料处理等环境保护领域中的应用现状,以及有机粘土矿物的应用,并介绍了粘土矿物在节能、空气净化、生态建材、抗菌材料等方
李克强总理在今年所作政府报告中强调:“各级政府要坚决反对和整治一切形式主义、官僚主义,让干部从文山会海、迎评迎检、材料报表中解脱出来,把精力用在解决实际问题上。”近日
报纸
《孟子》中“若”字共出现96次,而《齐桓晋文之事》中就出现了11次,其例如下:(1)若寡人者,可以保民乎哉?(2)吾不忍其觳觫,若无罪而就死地。(3)即不忍其觳觫,若无罪而就死地,故以羊易之也。(4
以安徽省2004年第七次森林资源清查、2009年第八次森林资源清查和2014年第九次森林资源清查结果为基础,从森林资源总量、森林质量、林木生长量和消耗量等角度,分析了2004~201
城市经济的飞速发展,拉大了城乡之间的经济差距,而地区间经济发展的不平衡现象将长期存在。相较于农村,城市的就业机会更多,工资待遇及其他方面也更具有优势,这种城市优势下,
2014年后,我国信用债违约事件频繁发生,违约金额、违约主体数量不断增加。现阶段,信用债违约呈现出常态化的趋势。在此背景下,研究我国信用债违约的影响因素,构建企业违约模
随着时代的发展,当今社会对人才的培养要求越来越高,STEAM教育理念应运而生。STEAM教育理念最早开始于美国,近几年在世界各国掀起教育改革的风潮。STEAM教育就是集科学等多学
未来5-10年是增强现实技术的应用爆发时代。增强现实的基础是视频,目前世界上的两大视频源分别是手机和监控摄像机。基于手机的增强现实应用在世界各地已经展开了研究。然而,
目的为满足人们对于微量元素硒的日常膳食需求,通过将低级生物利用的无机硒代谢成高级生物可利用的有机硒,增加乳杆菌的硒含量,找出最佳培养方案。方法首次选用植物乳杆菌作