【摘 要】
:
命名实体识别是一项从非结构化大数据集中抽取有意义的实体的技术。命名实体识别技术有着非常广泛的应用,例如从轨道交通列车产生的海量运行控制日志中抽取日期、列车、站台
【机 构】
:
浙江大学计算机科学与技术学院,浙江省大数据智能计算重点实验室,浙江华云电力工程设计咨询有限公司
【基金项目】
:
国家重点研发计划课题(2017YFB1201001)
论文部分内容阅读
命名实体识别是一项从非结构化大数据集中抽取有意义的实体的技术。命名实体识别技术有着非常广泛的应用,例如从轨道交通列车产生的海量运行控制日志中抽取日期、列车、站台等实体信息进行进阶数据分析。近年来,基于学习的方法成为主流,然而这些算法严重依赖人工标注,训练集较小时会出现过拟合现象,无法达到预期的泛化效果。针对以上问题,本文提出了一种基于强化学习的协同训练框架,在少量标注数据的情况下,无须人工参与,利用大量无标注数据自动提升模型性能。在两种不同领域的语料上进行实验,模型F1值均提升10%,证明了本文方法的有效
其他文献
本文研究了西昆仑造山带南带的新疆赛力格塔什刚玉矿床,该矿床赋存于古老基底的变质岩系中,含矿岩石为眼球状黑云母长石片麻岩,眼球部分由刚玉(中心)及钾长石(外围)组成,基体
本文针对汉英翻译中引起中式英语的一个主要原因——意合与形合进行分析,回答了什么是意合和形合,为什么汉语是意合而英语是形合;并且,对于由于意合与形合的差异所引起的汉英
北宋名贤蔡襄(1012~1067),字君谟,福建兴化仙游人."年十八举进士,为开封第一.(仁宗)天圣八年,登进士甲科,为西京留守推官."他累官直史馆、知谏院、馆阁校勘兼起居注,历知开封
传统互联网数据中心存在物理机资源利用率低下、难以适应业务发展需求、管理复杂和运维成本居高不下等难题,以服务的形式通过互联网交付给用户虚拟资源的云计算数据中心应运
由中国价值哲学研究会、武汉大学哲学学院、武汉大学马克思主义理论与中国实践协同创新中心、德国卢森堡基金会联合主办的主题为“面向世界的当代中国价值观念”学术研讨会暨
新形势下,汉语热不断升温,外汉语工作推动全世界快速发展。在此背景下,改善外汉语教学方法、增强外汉语教学质量,成为不容忽视的问题。"先语后文"模式的生成,为外汉语教学改
该文运用文献资料法、专家访谈法、录像分析法、逻辑分析法,数理统计法对我国女子水球队关于快攻战术方面的优缺点进行分析,进而与国外优秀队伍进行比较,针对比较出的一些问
目的:观察黄芪对发作期哮喘患者T细胞亚群细胞周期的影响,揭示黄芪在哮喘治疗中的意义。方法:课题以儿童哮喘病人T细胞亚群为研究对象,对CD4+、CD8+T细胞进行分离,采用细胞培
骨髓纤维化属于中医"积聚""癥瘕""血癥""癥积"等范畴.此病为虚实夹杂证,贫血即血虚,脾大即血瘀,吴维海主任医师认为该病的发生和发展均与血虚、 血瘀有关,辨证辨病相结合,以祛瘀生新
硒是人体必需的微量元素,具有抗氧化、防癌抗癌、解毒排毒、提高机体免疫力等重要功能,维持机体适量的硒摄入能预防多种疾病。然而因全球普遍缺硒,膳食补硒已成为共识。富硒苹果