利用覆盖歧义检测法和统计语言模型进行汉语自动分词

来源 :电子与信息学报 | 被引量 : 24次 | 上传用户:yttgfnm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文探讨了利用覆盖歧义检测法和统计语言模型进行汉语自动分词的问题。采用了多次迭代的方法来进行汉语词层面统计语言模型的训练。该方法能够得到更优化的语言模型。该文详细介绍了统计语言模型的训练过程,给出了语言模型复杂度随迭代次数增加而减小的实验结果。还给出了在不同的统计语言模型阶数下切分正确率变化的情况,分析了切分正确率变化的原因。
其他文献
目的头孢他啶联合左氧氟沙星治疗心力衰竭患者肺部感染的效果及对血清炎症因子的影响分析。方法选择2016年11月-2018年11月本院收治的心力衰竭合并肺部感染患者60例作为研究
CORBA为构建大规模分布式应用程序提供了一套公共对象服务规范,其规范主要以IDL语言编写,只提供对象的静态行为描述。提出并应用扩展有色Petri网对CORBA对象进行形式化模拟和分析,结果表明扩展有色Petri网模型不仅能够清楚描述对象的静态行为,同时也能较好地模拟对象分布性和动态行为。
肛瘘是肛肠科的常见病和多发病,多由肛门直肠周围脓肿破溃后,余毒未尽,蕴结不散,气血凝滞,血行不畅,日久成瘘或因肛裂感深,虚劳久咳,肺脾两虚,湿热下注大肠所致^[1],本科2009年1~8月对30
以VD2为原料制备了1α,25-二羟基维生素D3的重要中间体(1S,6R)-1-羟基-6-(1,3-苯并二硫-2-氧)-3,5-环维生素D2.其中BDT(1,3-苯并二硫-2-氧)基团的引入有利于共轭三烯系统的保
研究了在几种反应体系中对叔丁基杯[6]-1,4-冠醚的合成,发现K2CO3/甲苯体系能高选择性地合成目标物,产率比文献报道提高了近一倍.并对反应机理作了初步探讨.
目的探讨老年2型糖尿病肾病患者不同时期骨转换指标与骨量相关性。方法根据糖尿病肾病(DN)分期标准和24 h尿白蛋白定量水平,将2017年1月—2018年5月在本院内分泌一科住院治疗
目的探讨急性脑梗死吞咽功能障碍患者接受早期干预对其康复期内营养状况以及日常生活能力的影响。方法选择科室收治的92例急性脑梗死吞咽障碍患者作为研究对象,以数字随机方
本文在对矿化垃圾的基本性质进行测定的基础上,将其作为填埋场覆盖材料进行室内模拟实验。结果显示:经过筛分后的矿化垃圾细料可作为回灌型准好氧填埋场的日覆盖材料,除了具有
在利用数值方法分析非均匀介质问题时,容易生成大型系数矩阵,从而在求解时常常造成计算机内存不足或者计算时间过长。该文利用区域分解方法对三维非均匀介质成像问题进行分析,通过将求解区域划分为几个子区域,在子区域上以迭代求解子问题的方式解决以上问题。文中给出的迭代收敛速度曲线证明区域分解算法的收敛速度很快。该文对一些复杂的非均匀介质问题给出了模拟测量成像的结果。
[目的]探讨妊娠晚期会阴按摩联合凯格尔运动在初产妇自然分娩中的应用价值。[方法]将200例自然分娩的初产妇随机分为对照组和观察组各100例。对照组按照常规护理产检接生,观