语音智能助手的评测框架

来源 :清华大学 | 被引量 : 0次 | 上传用户：guojunaaaa

【摘要】

：

语音智能助手是指通过自然语言交互为用户提供服务的智能助手。本论文通过扩展评测指标、建立评测准则、设计并验证评测工具,建立了语音智能助手的评测框架。评测指标是评测

【作者】

：

纪翔

【出处】

：

清华大学

【发表日期】

：

2018年01期

【关键词】

：

语音智能助手评测框架出声思考分级准则分级工具

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音智能助手是指通过自然语言交互为用户提供服务的智能助手。本论文通过扩展评测指标、建立评测准则、设计并验证评测工具,建立了语音智能助手的评测框架。评测指标是评测质量的重要评估,本论文将评测指标从传统的客观绩效和主观评价,扩展到用户的认知过程,并比较了三种出声思考方法(回溯式、传统和交互式出声思考)在语音智能助手评测中获取认知过程的差异;评测准则是验证设计要素的重要依据,本论文提出了针对用户年龄分级为语音智能助手分级的准则,包括内容标签、交互行为和智能伦理三个维度,并在三种交互方式下(文本、语音及混合交互)验证了该准则;评测工具是提高成本效益的工具,本论文采用以用户为中心的设计流程,设计了语音智能助手分级工具VIARS(即Voice Intelligent Agent Rating System),并针对用户的经验差异和VIARS建议类型差异,验证了VIARS在不同指标评测中的可用性。研究结果表明:对于认知过程的获取,回溯式、传统、交互式出声思考方法各有优点,分别适合获取用户体验和原因解释类型文本、建议和预测类型文本、问题表述和建议类型文本;且回溯式和传统出声思考方法都可以获取更多的认知过程数据;评测时应根据具体的认知过程的收集目的选择对应的出声思考方法。对于分级准则,三个维度的不同指标水平均影响分级结果,准则的有效性均得到验证;且评测中混合交互方式会导致分级结果趋于宽松。基于该分级准则的VIARS设计,包含对话生成、语音转录、内容分析、结果展示和过程记录五个模块,并允许用户具有修改决策的控制权。对VIARS的可用性验证结果表明,专家分级结果具有更高的一致性,普通用户分级结果对VIARS具有强烈的依赖性;VIARS更适合评测规则型指标,而在评测经验型指标时应该将决策权交给专家;并且,在专家使用VIARS时,VIARS应多提供标准型建议而避免防御型建议。至此,本论文从评测指标(认知过程)、评测准则(分级准则)、评测工具(VIARS)三个方向,完成了对语音智能助手的评测框架建立,为未来的语音智能助手评测工作提供了理论参考。

其他文献

宽幅摆臂式上料机设计及关键问题研究

作为自动化生产线必不可少的设备,上料机是否性能稳定、工作效率高会直接影响工厂的生产效率。本文在对玻璃纤维无纺布分切作业流程进行研究和分析的基础上,设计灵感来自于旋

学位

上料机轻量化显示动力学动态特性

粘土矿物在环境保护领域的应用现状和发展前景

本文介绍了粘土矿物在废水处理、固体废物处理、核废料处理等环境保护领域中的应用现状,以及有机粘土矿物的应用,并介绍了粘土矿物在节能、空气净化、生态建材、抗菌材料等方

会议

粘土矿物有机粘土矿物环境保护现状前景

搬“文山”填“会海”为基层松绑减负

李克强总理在今年所作政府报告中强调：“各级政府要坚决反对和整治一切形式主义、官僚主义，让干部从文山会海、迎评迎检、材料报表中解脱出来，把精力用在解决实际问题上。”近日

报纸

《齐桓晋文之事》中的“若”字

《孟子》中“若”字共出现96次，而《齐桓晋文之事》中就出现了11次，其例如下：（1）若寡人者，可以保民乎哉？（2）吾不忍其觳觫，若无罪而就死地。（3）即不忍其觳觫，若无罪而就死地，故以羊易之也。（4

期刊

齐桓晋文之事《齐桓晋文之事》羊易之

基于森林资源清查体系的安徽省森林资源动态变化分析

以安徽省2004年第七次森林资源清查、2009年第八次森林资源清查和2014年第九次森林资源清查结果为基础,从森林资源总量、森林质量、林木生长量和消耗量等角度,分析了2004~201

期刊

森林资源清查体系动态变化安徽

公共治理视角下W县农村留守儿童教育问题研究

城市经济的飞速发展,拉大了城乡之间的经济差距,而地区间经济发展的不平衡现象将长期存在。相较于农村,城市的就业机会更多,工资待遇及其他方面也更具有优势,这种城市优势下,

学位

留守儿童教育公共治理

我国信用债的违约特征识别

2014年后,我国信用债违约事件频繁发生,违约金额、违约主体数量不断增加。现阶段,信用债违约呈现出常态化的趋势。在此背景下,研究我国信用债违约的影响因素,构建企业违约模

学位

信用债违约风险Logit模型信用环境

STEAM理念融入科学课堂对学生创造力培养的实验探究

随着时代的发展,当今社会对人才的培养要求越来越高,STEAM教育理念应运而生。STEAM教育理念最早开始于美国,近几年在世界各国掀起教育改革的风潮。STEAM教育就是集科学等多学

学位

小学科学STEAM理念创造力培养实验探究

基于北斗高精度定位的增强现实系统的设计

未来5-10年是增强现实技术的应用爆发时代。增强现实的基础是视频,目前世界上的两大视频源分别是手机和监控摄像机。基于手机的增强现实应用在世界各地已经展开了研究。然而,

学位

视频监控增强现实北斗高精度空间网格

正交实验对植物乳杆菌Lb-30硒化的多因素条件筛选

目的为满足人们对于微量元素硒的日常膳食需求,通过将低级生物利用的无机硒代谢成高级生物可利用的有机硒,增加乳杆菌的硒含量,找出最佳培养方案。方法首次选用植物乳杆菌作

期刊

植物乳杆菌食品安全富硒培养基富硒培养条件优化

语音智能助手的评测框架

与本文相关的学术论文