字符序列标注的维吾尔语词干提取方法

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:angle4781
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词干提取是形态丰富语言信息处理中的基础任务,对其他自然语言处理任务有着重要的影响。该文将词干提取任务看作序列标注问题,以字符为切分粒度来表征维吾尔语单词的构成机制,结合条件随机场模型,实现基于字符序列标注的维吾尔语词干提取方法。首先使用词典查询方法进行词干提取,然后结合字符的弱化发音特征、音类特征以及语音特征,针对受限数据和非受限数据采用条件随机场训练模型及预测结果。实验结果表明,该方法在非受限数据集上效果较佳,且能广泛应用到其他语言。
其他文献
对国内外创业资本家和创业者(企业)之间的合约激励、控制权分配、监管研究现状进行归纳、总结和评述,提出目前中国创业投资市场急需要解决的投资者和创业资本家、创业资本家和
产业政策是政府实施的与调节产业活动相关的政策总和。产业政策更多的是反映市场与政府的职能边界。同时,产业政策的制定与执行过程,其背后隐藏着深刻的利益关系。在阐释产业政
兖州矿业(集团)公司机械制修厂从设计变量的选择、目标函数的建立、约束条件的确定、数学模型的尺度变换、数据表和线图资料的使用、优化结果的分析与处理等方面对机械优化设计
兖州矿业(集团)有限责任公司针对焦化生产铁路运输量大及传统人工平焦方式存在安全隐患的情况,研制出了新型平焦装置。
随着现代计算机技术的发展,将一些大型的软件运用于物理化学实验数据处理方面,会使得物理化学实验数据处理更加方便、快捷、准确。本文运用Origin、Matlab、SAS、EViews以及E
目的:对1例妊娠期糖尿病患者的治疗过程进行药学监护,探讨临床药师对妊娠期糖尿病患者药学监护要点。方法监测患者在用药期间的血糖变化,及时调整用药方案。结果临床药师参与妊
20世纪80年代后,在中国改革开放政策的指引下,中国的经济建设取得了举世瞩目的伟大成就,人民生活水平有了很大提高。经济的发展,必然使民众对文化教育提出更高的需求,音乐于是便成
当前水下裂缝缺陷检测中存在误检率高、漏检率高、实时性不强等问题,需要大量准确地标注数据集对识别模型进行训练。针对大量标注数据集的需求问题,提出一种目标智能标注系统,利用基于通道和空间可靠性理论改进的核相关滤波跟踪算法(CSR-KCF),对水下裂缝进行目标跟踪,结合标注系统功能需求,展开对该系统的设计与实现。实验结果表示,提出的目标智能标注系统符合设计需求,能够实现对水下裂缝缺陷准确、快速、可靠的智
心理数线是数概念发展的重要组成部分,与各种数学能力的发展密切相关。本研究选取江苏某两市487名3~5岁儿童为被试,通过数线估计任务和潜在类别分析的方法,考察儿童在两种不