融合多策略的维吾尔语词干提取方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:phf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语是形态变化复杂的黏着性语言,维吾尔语词干词缀切分对维吾尔语信息处理具有非常重要的意义,但到目前为止,维吾尔语词干提取的性能仍存在较大的改进空间。该文以N-gram模型为基本框架,根据维吾尔语的构词约束条件,提出了融合词性特征和上下文词干信息的维吾尔语词干提取模型。实验结果表明,词性特征和上下文词干信息可以显著提高维吾尔语词干提取的准确率,与基准系统比较,融入了词性特征和上下文词干信息的实验准确率分别达到了95.19%和96.60%。
其他文献
采用统一的统计参数计算方法分析计算了全国0.51万~1.36万个雨量站历时为10 min~3 d的暴雨资料、210个站历时为1 d~90 d和1 a的降水资料的偏态系数和变差系数比值Rsv。探讨了
电解质中微量元素的含量不同,导致电解质的性质发生很大变化,针对兰州分公司高Ca F2、Li F、KF含量的复杂电解质体系,通过调整技术条件、添加适合的保温料,重点控制好过热度,
2012年9月,国家社科基金重大委托项目子课题《武威地区境内西夏遗址调查研究》项目组先后对古浪县寺洼寺院遗址和天祝县百灵寺遗址进行了全面调查。在调查中发现的大量残存遗
目的了解不同年龄及文化程度农村妇女健康生命质量状况。方法采用分层整群随机抽样方法抽取四川省安岳县、安徽省临泉县、山东省曹县和茌平县妇女1653人,利用欧洲生存质量测
互联网时刻面临着各种各样的攻击和威胁,校园网也面临着严重的挑战和威胁.ARP协议欺骗是网络欺骗的行为之一,利用ARP协议自身的安全缺陷,攻击者可以重新伪造一个以太网上的IP数据
<正> 贫困作为一种经济病态现象,现今很难再有人引以为荣了。扶贫已被列为党的富民政策的重要内容,许多地方纷纷组织有关部门和农村党员、干部、专业户,落实扶贫责任制,帮助
期刊
分清辩证唯物主义、历史唯物主义同唯心主义形而上学的界限李为善分清辩证唯物主义、历史唯物主义同唯心主义形而上学的界限,是当前思想理论战线面临的一个重要问题。辩证唯物
社会利益多元的类型$$首先,社会阶层分化导致的利益多元。比如房价上涨的时候很多媒体抱怨人们买不起房,政府也采取了很多措施来遏制高房价,以保护无房者的利益。但房价下跌时,各
报纸
基于微波等离子体炬离子源研制了一台四极杆质谱仪(MPT-QMS),并将其用于水样痕量金属元素的检测分析。系统地研究和阐述了离子漏斗对仪器性能和分析结果的影响。实验发现,可以