利用词性标注语料库自动推断维吾尔语词缀变体的研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:zhoujans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
即对词根和词缀以维吾尔语语法为基础,作出语法和词汇定义,通过现代信息处理事业广泛运用的机器学习方法,计算词缀和词根聚合概率,将概率意义为主,自动推断文本中的单词聚合失误和符合词根的词缀自动选择原理。 That is to say, grammar and vocabulary are defined based on Uyghur grammar for stems and affixes. Machine learning methods widely used in modern information processing are used to calculate the probability of affix and root polymerization, and the probability is the main factor to automatically infer the aggregation of words in the text Error and stemming affix automatic selection principle.
其他文献
目的:胆囊癌是一种相对少见的恶性肿瘤,其发病率与环境因素和遗传因素均相关。胆囊癌恶性程度较高,预后较差,一般发现时患者已处于胆囊癌进展期。目前大多数研究的焦点是原癌基因
基于江西省水资源现状,构建了科学有效的江西省水资源承载力评价指标体系,采用RBF神经网络对江西省2006-2015年水资源承载力以及2015年江西省各市水资源承载力进行了评价,结
梨花诗的口语化与中国古典诗歌通俗化趋势一脉相承,梨花诗是现代白话诗的极致——它既是对现代白话诗语言形式的继承,也是对其思想内容的反叛;梨花诗渗透着打油诗的讽刺批评
文章对无线扬声器使用的频段和未来对频谱的需求进行了分析和介绍,并对数字、模拟无线扬声器进行了比较。
上海郊区工业园区二次开发在取得一定成绩的同时,也面临着二次开发的制度设计有所欠缺、管理机制尚不健全、政策配套有待完善等诸多问题和瓶颈。为此从完善顶层设计、强化机
社会主义市场经济的发展和改革开放的不断深入,使社会群体分化加快,由于收入差距的拉大,不同群体之间出现利益摩擦,给党的执政能力带来严峻考验。人民之间利益关系的变化,客观上要
<正>值得特别强调的是,坚持"‘老虎’、‘苍蝇’一起打",必须在坚持党的领导、人民当家作主、依法治国有机统一的大环境中,才能把握正确的方向,寻获强大的动力,取得长久的成
根据冬季农村居民的采暖现状,按照"安全、环保、节能、经济"的要求,提出了整体式低环温空气源热泵机组供热系统、变频低环温空气源热泵机组供热系统以及变频低环温空气源热泵
近年来,恶性黑色素瘤的发病率在全球范围内快速增长,已经成为人类皮肤类癌症中第三大疾病,并且由于它的预后高风险和极高的肿瘤转移率大大提高了人们治愈它的难度。尽管人们对黑
目的:研究Crk衔接蛋白下游信号DOCK180/Rac1、SOS1/Ras对人浆液性卵巢癌生长和侵袭行为中的作用。方法:1.用GST-pull down检测不同卵巢组织中Rac1-GTP、Ras-GTP的表达;并用Weste