短语抽取相关论文
汉语分析技术是中文信息处理的基础.目前,汉语词法分析技术已比较成熟,但在词法分析之上的短语分析及句法分析仍然很不成熟.究其原......
主题模型可以帮助发现专利文本中潜在的语义信息,并且以概率分布的方式展现出来。其结果具备良好的数学性质,简单直观,不但可以帮......
提出一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维语词的情况(包括不连续),然后采用Och方法进行判......
期刊
双语短语对抽取是基于短语的统计机器翻译中短语翻译模型训练的关键步骤,但由于汉维平行语料库规模有限,数据稀疏问题严重.本文提......
针对基于短语统计机器翻译中目前常用的Och提出的短语抽取算法,提出了一种改进算法。该算法能够在原有算法的基础上抽取出更多的准......
文本主题提取技术能够有效地精炼文本消息,传统的中文文本由最基本的词语组成,由于词汇本身的信息粒度过小,针对词语进行中文信息......
在中文专利主题挖掘研究中,针对基于单词的传统主题模型结果可解释性较差问题,提出一种融合词向量和Ge- neralized Pólya urn......
在当今信息时代,由于信息量很大,而且读者也没有太多的时间把想要了解的书完全通读。书后索引不仅能帮助读者快速查找专有名词,而......
为克服传统的短语抽取方法对词对齐信息的依赖性强,抗噪声能力差这一缺陷,提出基于词汇相似度约束的短语抽取策略;在此框架下,提出......
新词/短语的识别是自然语言处理、信息检索和机器翻译等领域的一项基础研究。该文分析了已有短语抽取技术,并结合汉语特点,提出了......
上世纪90年代前后,IBM Watson研究中心的Brown等人提出了基于信源信道模型的统计翻译方法,此类方法的性能远远超越了传统的基于规则......
统计机器翻译包括两个模型的训练,其中短语翻译模型训练中的关键步骤是双语短语对的提取。怎样提取到准确和足够多的双语短语对成......
机器翻译在不同语种之间的交流中起着非常重要的作用,一直是自然语言处理研究的热点和难点。越南是中国西南的重要邻国之一,研究汉......
随着我国企业每年专利申请量的不断增多,一些专利申请乱象日渐显现:国家为专利申请制定了扶持与鼓励政策,有的企业为了争取这些政......
汉语缩略语在现代汉语中被广泛使用,其研究对于中文信息处理有着重要地意义。该文提出了一种从英汉平行语料库中自动提取汉语缩略......