限定领域口语对话系统中超出领域话语的对话行为识别

来源 :第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD | 被引量 : 0次 | 上传用户:JessicaGu45
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于领域外话语具有内容短小、表达多样性、开放性及口语化等特点,限定领域口语对话系统中超出领域话语的对话行为识别是一个挑战.本文提出了一种结合外部无标签微博数据的随机森林对话行为识别方法.本文采用的微博数据无需根据应用领域特点专门收集和挑选,又与口语对话同样具有口语化和表达多样性的特点,其训练得到的词向量在超出领域话语出现超出词汇表字词时提供了有效的相似性扩展度量.随机森林模型具有较好的泛化能力,适合训练数据有限的分类任务.中文特定领域的口语对话语料库测试表明,本文提出的超出领域话语的对话行为识别方法取得了优于最大熵、卷积神经网络等短文本分类研究进展中的方法的效果.
其他文献
随着互联网整体水平的提高,大量基于维吾尔文的网络信息不断建立,引起了对不同领域的信息进行情感倾向性分析的迫切需要。该文考虑到维吾尔文没有足够的情感训练语料和完整的
在实现信息系统过程中,多个异地的数据库需要实现相互同步.不同的数据库系统根据本身规则提出的数据库同步方案五花八门,而且约束繁杂.所以数据库管理员可根据系统环境不同编
近人所谓美食家,说白了便是“老饕”、“天吃星”的雅称。我因无才补天,“无聊读书”,对饮食文化偶有涉猎,无意间不幸有了这个“谥”号。其实,我既从不狼吞虎咽,也并未刻意饮食养生
针对微博情感分类问题,构造了基于三维坐标的模糊量化情感分类算法,通过将情感模糊量化,对微博进行多情感分类。首先对情感模糊处理,将情感分为六大类,根据六大类,定义并计算
该文主要研究在微博社交网络中怎样评价用户的影响力。在影响用户影响力的众多因素中,该文认为用户的传播能力越强,用户的信息便可以更快地在网络中扩散,其影响力也越大。和
喜欢看旅游卫视的一档专门介绍烹饪世界各地美食的栏目。首先喜欢这档节目的风格,谁能想像到厨房搬到了风光如画的外景,就在某个国度,就在某个城市!也许是绮丽的花园、也许是蔚蓝
社交媒介已经成为了一种分享交换信息的重要平台,识别出其中影响力高的用户已经广泛地应用于推荐系统、专家识别、广告投放等应用。该文提出了一种受限张量分解方法,其能识别
识别比较句并提取被比较事物之间的关系是细颗粒度意见挖掘的重要研究内容之一。该文给出维吾尔语比较句的范畴、语法特点,定义了维吾尔语比较句识别的任务。提出两层识别模
农村新天地取字“新天地”,与市区那个熙熙攘攘的地方有相似之处,也有截然不同。人造瀑布、小桥流水乍看起来真有点儿情调,但内里却是完完全全的农家特色。有农的乐趣,有现代的便
为了向上海的饮食业界介绍和宣传日本东北地方的丰富的食材,特举办日本东北博览会in上海--食材博览会。这次博览会的对象,主要是针对上海地区的餐馆、宾馆、食品关联企业和食
期刊