基于半监督CRF的跨领域中文分词

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:cat521kiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文信息处理领域的一项关键基础技术。随着中文信息处理应用的发展,专业领域中文分词需求日益增大。然而,现有可用于训练的标注语料多为通用领域(或新闻领域)语料,跨领域移植成为基于统计的中文分词系统的难点。在跨领域分词任务中,由于待分词文本与训练文本构词规则和特征分布差异较大,使得全监督统计学习方法难以获得较好的效果。该文在全监督CRF中引入最小熵正则化框架,提出半监督CRF分词模型,将基于通用领域标注文本的有指导训练和基于目标领域无标记文本的无指导训练相结合。同时,为了综合利用各分词方法的优点,该文
其他文献
红白相对始终生 共度盘旋轮入僧 四季时节烟头绕 只送经梵心渡声
从发展现代化教育的角度来看,不仅要求教育工作者在组织与实施教学中传授给学生知识,还要求引导学生养成主动思考问题、自主学习的学习习惯。这就要求我们在选择适当的教学方
总有聚散 更留曾经漫漫 留下的 是情怀还是夙愿 这已跨越重要
<正>~~
期刊
排比句具有结构紧凑、句式整齐、富有表现力等鲜明的特点,广泛应用在各种文体之中,在近几年语文高考的鉴赏类问题中也多有考察,但在自动识别方面的研究还鲜有涉及。该文依据
<正>~~
期刊
目前,维吾尔文命名实体识别研究主要集中在单类实体,且没有引入半监督学习方法,从而无法利用未标注语料的无监督语义和结构信息。该文以条件随机场为基本框架,提出了一种基于
随着社会经济的不断深入发展,国家已经开始提高对高校培养人才的要求与目标,近期普通高校艺术教育事业开始得到一定的重视,近年来普通高校声乐教学是作为普通高校音乐艺术教
法国作曲家福雷的《幻想的天际》是一部简洁、优美,属男中音声部的声乐套曲。本文将从演唱的视角对这部作品的语言、音乐、情感处理等进行分析,为演唱这部套曲提供一些参考,
目前,钢琴艺术指导在高校音乐教育教学中的重要作用日益凸显。在高校声乐教育中合理地运用钢琴艺术指导,可以帮助学生更加准确地把握音乐作品的内涵,了解演唱的技巧,增强学生