【摘 要】
:
问题分类旨在对问题的类型进行自动分类,该任务是问答系统研究的一项基本任务。本文提出了一种基于问题和答案共同表示学习的问题分类方法。该方法的特色在于,利用问题及其
【机 构】
:
苏州大学计算机科学与技术学院,江苏苏州215006
【出 处】
:
第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD
论文部分内容阅读
问题分类旨在对问题的类型进行自动分类,该任务是问答系统研究的一项基本任务。本文提出了一种基于问题和答案共同表示学习的问题分类方法。该方法的特色在于,利用问题及其答案作为共同的上下文环境,学习词的分布式表示,从而充分利用未标注样本中问题和答案隐含的分类信息。具体而言,首先,我们引入神经网络语言模型,利用问题与答案共同学习词向量表示,增加问题词向量的信息量;其次,加入大量未标注的问题与答案样本参与词向量学习,进一步增强问题词向量表示能力;最后,将已标注的问题样本以词向量形式表示作为训练样本,采用卷积神经网络建立问题分类模型。实验结果表明,本文提出的基于半监督问题分类方法能够充分利用词向量表示和大量未标注样本来提升性能,明显优于其他基准半监督分类方法。
其他文献
Traditional approaches to the task of ACE event extraction usually rely on complicated natural language processing(NLP)tools and elaborately designed featur
In Mongolian language,there is a phenomenon that many words have the same presentation form but represent different words with different codes.Since typists
Recognizing Textual Entailment(RTE)plays an important role in NLP applications like question answering,information retrieval,etc.Most previous works either
随着深度学习和多模态融合的深入研究,问答系统从传统的纯文本方式扩展到结合图片的视觉问答,成为计算机视觉与自然语言理解的交叉研究热点.Hyeonwoo等最新提出的动态参数预测模型(DPPnet)能够简单、有效地实现问句和图片信息的融合.但是该模型在进行网络参数动态Hash分配时位置随机,缺乏图像内容空间分布的考虑.针对此不足,本文提出一种新的空间离散余弦Hash动态参数网络.算法采用全卷积方式提取保
For the difficulty of marking Vietnamese dependency tree,this paper proposed the method which combined MST algorithm and improved Nivre algorithm to build V
As a fundamental step in biomedical information extraction tasks,biomedical named entity recognition remains challenging.In recent years,the neural network
Chinese semantic dependency graph is extended from semantic dependency tree,which uses directed acyclic graphs to capture richer latent semantics of sentenc
Definition extraction is the task to identify definitional sentences automatically from unstructured text.The task can be used in the aspects of ontology ge
The primary task of language translation is to faithfully pass the meaning(s)of the source text to the target language.Unfortunately,meanings often get lost
研究基于矩阵分解的词嵌入方法,提出统一的描述模型,并应用于中英跨语言词嵌入问题.以双语对齐语料为知识源,提出跨语言关联词计算方法和两种点关联测度的计算方法:跨语言共