【摘 要】
:
人们在对话过程中,除了使用口语交互外,还会很自然地利用表情、姿态等多模态信息辅助交流。重点分析并阐述了如何将这些多模态交互方式有效地融合到人机对话模型中,并实现一
【机 构】
:
中国科学院自动化研究所模式识别国家重点实验室
论文部分内容阅读
人们在对话过程中,除了使用口语交互外,还会很自然地利用表情、姿态等多模态信息辅助交流。重点分析并阐述了如何将这些多模态交互方式有效地融合到人机对话模型中,并实现一个面向自然交互的多模态人机对话系统。首先根据不同通道(如情感、头姿)对语音交互的影响,将它们主要分为信息互补、信息融合和信息独立3种模式,并针对3种模式分别采用不同的方式实现输入信息的多模态融合。信息融合后的对话管理,采用有限自动机、填槽法和混合主导方式的对话管理策略。针对对话中的情感处理,提出一种情感状态预测网络来记录用户的情感变化,并根据话语的轮转的不同对话上下文对用户情绪变化进行及时反馈,该对话模型能比较灵活地处理用户在对话过程中呈现的多模态信息。信息输出方面,针对人机对话中较为常用的数字虚拟人的行为控制,提出了一种简化的多模态协同置标语言,实现了虚拟人的包括情感、姿态与语音的同步表达,提高了虚拟人的表现力。最后基于以上关键技术,实现了一个面向城市路况信息查询的多模态自然人机对话系统。多个用户的体验表明,相对于传统的语音人机对话模型,多通道自然人机对话系统能有效提高用户交互的自然度。
其他文献
在数字化信息时代,信息的传递不再只是通过文字,而是图像信息占据了主流。图像信息在存储或者传输的过程中会被各种各样的噪声干扰,若直接对含噪图像信号进行后续的图像处理
针对孤岛工作面应力集中程度高、动压明显、围岩破坏严重、易诱发冲击地压等特点,在分析巷道围岩支护理论基础上,优化特殊地质开采条件下的巷道支护设计方案,提出采用顶板全
《诗经》中的《郑风》多为情歌 ,这与郑国地理、风俗有重大关系。溱、洧地处中原腹心 ,那里地势平坦 ,不仅土地肥沃 ,水源充足 ,适宜种植 ,而且道路辐辏 ,交通发达 ,经济繁荣
<正>先进制造,拼不过美欧日等发达国家;传统制造,价格上又遭遇东南亚、东欧等地区的包抄。失去成本优势的中国制造,究竟该何去何从?"纯制造业的竞争优势已经完全丧失!"日前,
为了将知识、信念、愿望和意图以及害怕、焦虑和自信对决策行为的影响的强烈程度进行形式化,把无穷值的卢卡斯维茨逻辑的真值取值范围从[0,1]扩展到[-1,1]。知识情感等级BDI
<正>8月14日晚,五粮液(000858.SZ)发布了2013年中报,上半年实现营业收入155亿元,同比增长3.12%;实现利润总额80.18亿元,同比增长15.32%,其中实现归属于母公司净利润57.91亿元
国家经济的快速发展,我国的建筑行业也在迅速的发展中,人们对所居住的环境要求也随之提升了,在新的发展时期和新的建筑要求的环境下,对建筑的室内装饰和装修工程的施工管理中
<正>对于外界口中的"商业神话",山内溥表示":我没有雄心壮志,今天的一切只是数次失败后的运气罢了。"9月19日,一个噩耗震惊了日本游戏界——著名游戏巨头任天堂公司前任董事
<正>中国体育市场和美国差别很大,收费模式可能难以走通。基于商业变现的冲动,乐视体育着手革新盈利模式以构建自己的"生态链"。乐视体育推出的首款自营IP游戏Shake Run于11
中国自古以来就是一个重视人伦亲情的国度,亲情诗在中国诗歌中是一个重要的题材领域。《诗经》是中国诗歌的源头,自然也是中国古代亲情诗的源头。“诗三百”中有关人伦亲情的