融合多策略的维吾尔语词干提取方法

来源 :中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标 | 被引量 : 0次 | 上传用户:heying423
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  维吾尔语是形态变化复杂的黏着性语言,维吾尔语词干词缀切分对维吾尔语信息处理具有非常重要的意义,但到目前为止,维吾尔语词干提取的性能仍存在较大的改进空间.本文以N-gram模型为基本框架,根据维吾尔语的构词约束条件,提出了融合词性特征和上下文词干信息的维吾尔语词干提取模型.实验结果表明,词性特征和上下文词干信息可以显著提高维吾尔语词干提取的准确率,与基准系统比较,融入了词性特征和上下文词干信息的实验准确率分别达到了95.19%和96.60%.
其他文献
本文主要研究了磁性流体的流变特性,特别是不同载液,不同固含量的磁性流体粘滞特性。 (1)论文中首先测定了毛细管流变仪的仪器常数,并使用毛细管流变仪测量了不同浓度磁性流
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
大肠杆菌是存在于人体和其它高等动物肠道内的正常菌群。属于条件致病菌,在宿主免疫力低下或者菌群感染寄主肠道以外其它地方时候能引起胃痛、呕吐、腹泻和菌血症等病症反应。
  本文旨在探索一种面向微博的社会情绪词典构建方法,并将其应用于社会公共事件的情绪分析中.首先通过手工方法建立小规模的基准情绪词典,然后利用深度学习工具word2vec对社
会议
如何科学制定贸易政策,决定着深度融入经济全球化和以开放促发展的我国,在国际贸易格局变化中自身经济的走向和未来命运。然而直至目前,国内学界对这一问题的深入研究却相对
目的:MLL(mixed lineage leukemia)基因异常是急性白血病中一种非常常见的染色体异常,大多数发生MLL基因异常的急性白血病预后很差,是血液病研究领域的热点。MLL-AF4阳性的急性
判断创业板市场的价值,必须将市场本身与上市公司区别开来,绝不能因为几筐苹果烂了就否定创业板市场存在的价值创业板自年初至今跌幅高达27%,相比去年12月底的高位,跌幅已逾3
秦岭淮河一线为中国的一条重要南北地理分界线,秦岭是东西走向山脉,山脉的中段位于陕西省境内,是黄河和长江的分水岭,也是800 mm等降水量线和一月份0℃等温线的通过地,属于气
水资源匮乏和水质下降成为日益严重的问题,因此像膜生物反应器(Membrane bioreactor,MBR)这种先进的污水处理和回用技术应运而生。然而,膜污染成为MBR应用中的主要挑战。本文以浸没式MBR中膜污染的控制为研究对象,在研究了吸附树脂(Adsorption resin,AR)对溶解性微生物产物(Soluble microbial products,SMP)的吸附机理和SMP对聚偏氟乙烯
学位
  社会地位与权势的研究一直是社会语言学领域的一个热点话题。本文借助数据挖掘中的关系提取方案雪球算法(Snowball Algorithm),实现了红楼梦文本中候选的特征语言模式(pat
会议