口语对话系统中的对话行为识别研究

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:morningwind2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面向任务(task-oriented)的限定领域(restricted domain)口语对话系统(spoken dialogue system,SDS)因专于某一特定的任务,能帮助人们完成更多的问题和工作,比开放领域的聊天机器人更有研究和应用价值。对话行为(dialogue act,DA)识别是处理用户话语的关键环节,是后续对话控制和应答的基础。在研究进展中,DA识别通常被当作短文本分类问题,但口语对话系统话语通常具有的噪音多、特征稀疏和主题不明确等特点,DA识别仍然存在许多挑战。根据用户话语是否携带领域语义信息,本文将其分为领域内(in domain,ID)话语和领域外(out of domain,OOD)话语,并在手机导购领域口语对话系统的对话语料中验证了ID和OOD话语分别单独进行DA识别的方法,能有效地提升口语对话系统的总体DA识别准确率,从而确定了ID和OOD话语分离进行DA识别优化研究的方案。在ID话语的DA识别上,综合使用多种词汇、语法、语义等特征,并利用长短期记忆人工神经网络(long-short term memory,LSTM)的序列性刻画对话历史等上下文信息,使得对话行为识别从单句扩展到语境中的理解。而在OOD话语的DA识别方面,考虑到卷积神经网络(convolutional neural network,CNN)在特征表达方面的优势以及随机森林(random forest,RF)模型良好的泛化能力,本文提出一种CNN-RF混合模型的OOD话语DA识别方法,综合了基于CNN的局部特征提取器和基于随机森林模型的DA分类器。本文的实验数据来自于所在研究室实现的中文手机导购口语对话系统。DA类别是以国际标准化组织拟订的新对话行为标注体系(ISO 24617-2 2012)为基础,参考SWBD-DAMSL对话行为标注拟定的,包括5种ID话语DA和25种OOD话语DA。各种DA识别模型通过交叉验证的方式进行了参数选择。实验表明,本文提出的ID和OOD话语的DA方法均取得了优于研究进展方法的效果。
其他文献
在开展"两学一做"学习教育过程中,结合高校特点,制定了"两学一做"专题教育实施方案,创新"两学一做"学习方式、学习制度和学习载体,发挥党员模范带头作用,加强高校党的基层组织建设,
高校物资设备采购领域廉政风险防控是高校健康发展的需要。目前高校物资设备采购筹资渠道多元,支出金额巨大;采购部门职责不清,权力相对集中;采购类型繁多,缺乏统一标准。高校物资
2010年12月6日,中国钨业协会在北京隆重召开五届三次理事会暨专家报告会。中国有色金属工业协会会长康义出席会议并发表重要讲话,国务院国资委行业协会联系办公室梁方处长、
一种含钼的钨酸钠溶液中分离钼用的硫代钼酸盐制备方法。它是用含NaOH:0.5~20g/L:WO3:40~280g/L;Mo:0.2~3.5g/L的钨酸钠溶液作料液,按料液中含Mo总重量的7~15倍加入硫作硫化剂,于反应容器中
随着我国政府和社会资本合作(PPP)模式的快速发展,越来越多的PPP项目进入运营期,面临着绩效评价的局面,但当前以政府为主导的评价工作存在着诸多弊端,难以充分发挥评价的作用
1概况今年1~9月我国钨品出口14459.7t,较上年同期减少4660t,减幅24.4%;出口额1.27亿美元,较上年同期减少7277.6万美元,减幅36.5%.进口量1239t,较上年同期增加560.3t,增幅82.6%
中国现有钨资源中73%为白钨,同时41%以上属高钼矿,且越来越复杂难选,为适应新的资源形势的要求,我们发明了新的NaOH分解法和选择性沉淀法,前者能有效地从各种钨矿物原料(包括
简要评述了2002年1~4月世界钨市场状况,并展望了近期钨市场的前景.由于钨市场需求较弱而供应比较充足,且有大量库存待消耗,2002年1~4月钨精矿和仲钨酸铵价格连续下滑,一些钨生
绩效评价是PPP项目全生命周期中必不可少的评价和反馈。污水处理厂作为关系国计民生的重要基础设施项目,对于保护环境,促进经济社会可持续发展有着不可替代的作用。而目前此
自扫黑除恶工作开展以来,全国打掉了一批涉黑涉恶组织和“保护伞”,其中不乏村“两委”干部。有关统计数据表明,在2019年截至9月25日,排查整顿软弱涣散村党组织7.38万个,清理