蒙古文词根、词干、词尾的自动切分系统

来源 :内蒙古大学学报(人文社会科学版) | 被引量 : 0次 | 上传用户:maliuzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上考察和比较了蒙古语的词根、词干和构形词尾,在传统语法的研究成果和计算语言学方法相结合的基础上把蒙古文近200种词尾分成三大类,并根据各类词尾的不同特点编制了几种词典,设计,提出了二十多组语法条件和若干个生成规则,在计算机上实现了自动切分。据测试,使用该系统可以覆,盖现代蒙古语各类文本的95%以上。
其他文献
随着我国经济的快速发展,社会的不断进步,科学技术的发展突飞猛进。"中央厨房"作为一种新兴的新旧媒体融合模式出现在大众的视线里,为我国的媒体时代的发展指明了方向。随着
目的研究白蛋白、视黄醇结合蛋白、前白蛋白在重症ICU患者营养治疗中的应用。方法选择2013年5月至2014年8月期间ICU收治的重症患者40例以及体检的健康者40例进行研究,ICU患者
目的观察微课教育在支气管哮喘患者出院后自我管理中的应用效果。方法 2015年1月至2016年12月在该院住院的支气管哮喘患者120例,根据入院顺序分为对照组与观察组各60例。对照
最近几年,中国宏观经济波动率明显下降,但没有引起理论界和政策层的足够重视。本文针对这一问题,运用微观层面的时滞效应、群体博弈理论和宏观层面的蛛网模型理论,结合中国的
<正>河南郑州读者林某来电说院女袁40岁袁近一年来饱受阴道炎的折磨袁尤其是在炎热天气里袁外阴瘙痒袁白带为豆腐渣样并有较重异味遥每次看病后袁使用一段时间的妇科治疗药物
<正>极低、超低出生体质量儿及一些危重新生儿住院、禁食时间长,经常需要长期静脉输液和全胃肠外营养(TPN),输注高渗性或黏稠性液体,如脂肪乳、蛋白等,可供穿刺的血管少而细,
根据氯化氢合成过程中的工艺特点,分析了氯氢纯度、流量、冷却水量及氯化氢纯度等要素对氯化氢及盐酸生产过程的影响,指出了其关键控制技术点,针对实际操作过程中容易发生的
目的探讨单核细胞/高密度脂蛋白比值(MHR)、单核细胞/淋巴细胞比值(MLR)与非ST段抬高型心肌梗死(NSTEMI)及冠状动脉病变严重程度的关系。方法选取2014年6月—2018年1月蓬莱市
溃疡性结肠炎属中医学“肠澼”、“下利”、“久泄”、“久痢”范畴,该文从中医学角度论述溃疡性结肠炎的病名、病因病机及其证候,并论述了历代针灸治疗该病的取穴特点,以及
<正>压疮多见于昏迷、尿失禁、营养缺乏、长期卧床等不能自主翻身的重病患者,压疮不仅给患者带来痛苦,而且明显延长了住院时间,增加了医疗费用,甚至引起患者死亡。因此,预防