【摘 要】
:
汉语中许多新生的词语都是短语的缩略形式.对缩略语的检测是未登录词识别的一部分,但用来作为训练语料的缩略语词典资源却很稀缺.本文提出一种在生语料中自动抽取中文缩略语
【机 构】
:
中科院计算技术研究所,北京,100080
论文部分内容阅读
汉语中许多新生的词语都是短语的缩略形式.对缩略语的检测是未登录词识别的一部分,但用来作为训练语料的缩略语词典资源却很稀缺.本文提出一种在生语料中自动抽取中文缩略语的方法,首先获取候选缩略语集和源短语库,然后利用语言模型和对齐模型等特征进行候选缩略语和源短语的对齐,最后得到一部粗糙的缩略语词典.在实验中,在新词中进行缩略语提取的准确率达到了51.4%,召回率达到了81.7%.
其他文献
语音合成技术是信息处理领域的一项前沿技术,实现人机语音通信,将任意的文本转换成自然流畅的语音输出.藏语语音合成的研究刚刚起步,本文将给出藏语语音合成技术中文语转换(T
针对ISO标准算法并没有考虑可用比特数小于编码所需比特数的情况而不能实现编码音质的最佳化的问题,利用人耳对音频信号中的高频部分不敏感的感知特性,根据待编码音频信号各
目的为了评价3价流行性感冒(流感)裂解疫苗安尔来福TM的安全性和免疫原性。方法于2003年6~11月在广西壮族自治区南宁市和柳城县进行以进口同类疫苗为对照的临床研究。受试者
语音是人类相互交流和通信最方便快捷的手段,而语音中的韵律包含了说话人的意图信息,在帮助听者理解语言及意图时十分有用.对于韵律的研究是语音合成技术中的重要研究课题.本
本文讨论了藏语语音信号的分形维数特征,并利用分形维数特征对藏语语音信号进行分析和检测.提出了分形维数在藏语语音信号分析与检测中的两种具体应用方向,即藏语语音切分和
创业板的推出有什么意义? 谈到创业板的意义,香港联交所中国发展科执行总监彭如川先生从四个方面作了阐释。第一,有利于维护香港的金融中心地位。第二,可以给中小企业提供一
语音是人类相互交流和通信最方便快捷的手段,而语音中的韵律包含了说话人的意图信息,在帮助听者理解语言及意图时十分有用.对于韵律的研究是语音合成技术中的重要研究课题.该
本文首先介绍了什么是"语音声学参数数据库",接着论述了为什么要建立一个"统一的中国民族特性语言语音声学参数数据库",最后文章提出了具体的建议。
这篇论文基于两个语音数据库,统计了蒙古语口语中的辅音组合,并对辅音组合规律作了分析.蒙古语中的辅音组合可以分为音节内的复辅音和音节间的辅音串.音节内的复辅音组合规律
「语意网」(semanticweb)是未来网络发展的方向.而语意网技术中最重要的一环就是知识本体(ontology).我们讨论在未来网络时代,中文处理面临的挑战.特别是针对如何善用知识本