词表示相关论文
各类信息系统每天产生大量富含文本及其链接数据的文档集合,对这些文档集合进行挖掘可快速对其整合。文档分类是文本挖掘的主要任......
语言单元的表示是机器学习的基础工作之一,其旨在便于计算机能够更好地理解自然语言的语言单元。词是文本最基本的语义单元,是理解......
词向量能够以向量的形式表示词的意义,近来许多自然语言处理应用中已经融入词向量,将其作为额外特征或者直接输入以提升系统性能。......
当前岛司嵌入模型多数基于分布假设理论,这类模型将单词作为最基本语义单元,然后利用词的外部上下文信息学习词表示.然而,在类似于汉语......
词相似度计算在自然语言处理、信息抽取等研究中发挥重要作用。基于语料的词相似度计算是一类重要方法,其基本思路是从语料中学习......
随着自然语言处理的发展,依存句法分析作为一个重要的基础任务一直备受关注。依存句法分析旨在获取句子中词语之间的修饰关系,为机......
随着互联网的不断发展,每天都会生成大量的文本数据,如何使用无监督的方法处理海量的文本数据,从文本中提取出有效的语义或语法特......
生物医学命名实体识别主要是对生物医学文本进行有效的分析,进而识别出DNA、RNA、蛋白质等命名实体。它是生物医学信息处理的关键......
学位
基于互联网的自动问答基于搜索引擎返回的结果回答自然语言问题,可充分利用搜索引擎高质量的结果,省去存储大量文档的必要。答案抽......
蛋白质关系抽取和药物关系抽取对于生物医学领域相关数据库的构建、生命科学研究、药物开发和疾病的防治都具有重要意义。目前,大......
分布式词表示学习旨在用神经网络框架训练得到低维、压缩、稠密的词语表示向量。然而,这类基于神经网络的词表示模型有以下不足:(1......
自然语言处理研究主要应用机器学习方法,需要对词进行数学表示。词表示就是采用数学形式用词的属性对词进行的表示,在现有研究中,......
近年来,深度学习借助基于神经网络的词向量在自然语言处理领域大放异彩,席卷自然语言处理各项基础研究。词向量的质量直接影响上层......
提出一个基于表示学习的文本情感分析模型C&W-SP。首先基于C&W模型的词表示改进训练模型,实现在词表示训练过程中融入情感信息和词......
数据表示是自然语言处理的基础任务,传统的数据表示指的是通过人工整理特征信息的过程。近几年来,随着深度学习和表示学习的普遍使......
词的表示问题是自然语言处理中的关键问题之一。词的表示方法是否适当,直接影响着句法分析、语义表示和理解等任务的建模方法,也影......
蛋白质关系抽取是生物医学信息抽取领域的重要分支。目前研究中,基于特征和核函数方法的蛋白质关系抽取已被充分研究,并且达到了很......
生物医学命名实体识别是生物医学信息抽取的前提.目前实体识别大多采用机器学习的方法,依靠人工根据领域知识和经验制定特征,需要......