一种基于相似度的汉语语言模型平滑技术及其在音字转换中的应用

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:xiaoxiaodeai1002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对汉语语言模型中的数据稀疏问题,利用词语语义信息,将词语相似度同back-off平滑技术相结合,提出一种基于词语相似度的汉语语言模型平滑技术,并且设计了一种能够自动优化模型中各项参数的迭代算法,最后,将这种平滑技术由低阶语言模型推广到高阶语言模型中,将上述技术应用到音字转换领域。实验表明,这项技术使语言模型的性能获得了较大的提高,并有效地降低了音字转换系统的错误率。
其他文献
城镇化是当前中国经济发展的重要推动力之一,使得传统的二元经济结构发生了重要变化,不仅拉动了投资,并且促使居民生活方式转型,使得很多居民从农村生活方式转化为商品化、市
在预测问题中,如经济预测,天气预报,地震预报等,用户要求预报准确,尤其是所谓“大趋势”或“大方向”一定要报对,如明年是丰收还是歉收,股票未来升值还是贬值,汛期洪峰高还是低。
本文根据部件在(n,r)方案下的试验数据,用统计自助法对串联和并联系统的平均寿命作BCa区间估计,并进行模拟计算,说明这种方法的可行性,最后还编写了有关的计算机程序。
设有线性模型Yij=β0+σ0eij,i=1,2…,n…,j=1,2×,Ni。此处{eij}为独立同分布,且其均值为零,方差为1。本文提出对β0的随机加权估计,形如(8)所示的βn在e11 ̄N(0,1)和Ni≥6的条件下,我们于文中给出βn是β0相合估计的充要条件,并进一
在强调学生主体性教学思想指导下对体育课堂教学过程进行多方面的优化,以达到全面推进素质教育的目的.
本文证明了来自两个正态总体的两子样未必独立时,两子样方差仍相互独立,说明F检验法中要求两子样独立的条件是不必要的。
"效好便好"择业,"知难不难"创业,"诚信为本"兴业,构成了徽商系统的从业理念.全新的从业理念是徽商兴起、发展、壮大,进而"执中国商界之牛耳"的重要思想基础,是徽商称雄的"秘