基于CRF和半监督学习的维吾尔文命名实体识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:hrwhrw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,维吾尔文命名实体识别研究主要集中在单类实体,且没有引入半监督学习方法,从而无法利用未标注语料的无监督语义和结构信息。该文以条件随机场为基本框架,提出了一种基于半监督学习的维吾尔文命名实体识别方法。通过引入词法特征、词典特征、以及基于词向量的无监督学习特征,对比不同特征对识别的影响,并对模型进行优化。实验表明,CRF模型融合多种特征时维吾尔文命名实体识别的F值达到87.43%,说明词法特征和无监督学习特征的有机结合,可以大大减少人工选取特征的工作量,同时也可提高维吾尔文命名实体识别的性能;CRF模型相
其他文献
《未被回答的问题》作为20世纪优秀的管弦乐作品,一直为人们喜闻乐见.其作者美国作曲家查尔斯·艾夫斯的艺术创新,更是让人叹为观止.本文从《未被回答的问题》的音乐叙事
为了提高蒙古语语音识别性能,该文首先将时延神经网络融合前馈型序列记忆网络应用于蒙古语语音识别任务中,通过对长序列语音帧建模来充分挖掘上下文相关信息;此外研究了前馈
肝炎 B 病毒(HBV ) 感染仍然是一个世界范围的健康问题;然而,为长期的肝炎 B 的当前的抗病毒的治疗在功效被限制。HBV 感染的结果被认为是在 HBV 和主人免疫系统之间的复杂相互
烟草马赛克病毒(TMV ) 在与污染的水灌溉的易受影响的庄稼引起重要产量损失。然而,水里的 TMV 的察觉由于病毒的极其低的集中是困难的。这里,我们在灌溉水里为 TMV 的察觉和 qu
红白相对始终生 共度盘旋轮入僧 四季时节烟头绕 只送经梵心渡声
从发展现代化教育的角度来看,不仅要求教育工作者在组织与实施教学中传授给学生知识,还要求引导学生养成主动思考问题、自主学习的学习习惯。这就要求我们在选择适当的教学方
总有聚散 更留曾经漫漫 留下的 是情怀还是夙愿 这已跨越重要
<正>~~
期刊
排比句具有结构紧凑、句式整齐、富有表现力等鲜明的特点,广泛应用在各种文体之中,在近几年语文高考的鉴赏类问题中也多有考察,但在自动识别方面的研究还鲜有涉及。该文依据
<正>~~
期刊