基于伪标注样本融合的领域分词方法

来源 :四川轻化工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:gyivan0513
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前常用的神经网络分词模型,均需要大量的标注语料才可得到较好的泛化效果,但在面对领域标注语料稀缺的场景时,不能很好的适应。为解决这一问题,该文提出了一种基于伪标注样本融合的领域分词方法。该方法从领域专业辞典、电商及百科网站等数据源收集相关词汇组成领域词典,并从中随机抽取词汇生成伪标注样本。将伪标注样本与通用语料融合为训练样本,即将领域词典信息融合至模型训练当中。网络模型方面,该方法选用双向门限循环神经网络(Bidirectional Gate Recurrent Unit,BiGRU)作为主网络层,联合一
其他文献
文章阐述了南京市青奥森林公园建设现状,分析了郊野公园的目标及功能,提出了郊野公园的设计策略,包括设计策略、功能分区、专项设计,旨在提高郊野公园设计工作的效率。
以二水合钼酸钠(Na2MoO4·2H2O)、四水合钼酸铵((NH4)6Mo7O24·4H2O)作为钼源,硫脲(NH2CSNH2)为硫源,葡萄糖为碳源,采用水热法制备了二硫化钼(MoS2)/C复合材料。通过
采用离散位错动力学法(DDD)以及晶体塑性有限元法(CPFEM)对单晶(001)、(011)和(111)晶面进行纳米压痕模拟研究。分别分析了载荷-位移曲线、弹性模量、纳米硬度以及弹性回复率
文章阐述了电力工程监理的含义与具体工作内容,指出了电力工程质量监理过程中存在的主要问题,提出了电力工程质量监理过程中存在问题的解决措施,包括完善施工图纸监管流程、
白酒属于传统产业,其酿造过程将消耗大量的水资源和排放大量的污水废热。为了降低清香型白酒酿造过程的耗水量和排污量,设计了一种清香型白酒酿造工艺水资源循环利用和余热再
4-(5-羧基吡啶-2-)间苯二甲酸(H_3cpic)与硫酸锌在乙腈和水的混合溶液中通过溶剂热法合成了一种新型配位聚合物1([Zn(Hcpic)·(H2O)]n)。通过红外光谱、元素分析、X-射线
文章分别对市政工程施工阶段及竣工结算阶段影响造价的条件、造价存在的问题、造价管理与控制措施进行了研究和分析,旨在提升市政工程的施工质量和效率。
文章阐述了房屋建筑工程监理质量控制的重要意义,分析了房屋建筑工程中监理质量的控制要点,提出了完善房屋建筑监理质量控制的主要措施,包括做好施工前的监理工作、把控房屋
工程造价的科学管控对改善工程质量和提升企业经济效益有着重要作用,文章就建筑工程造价咨询的概念、造价咨询对造价控制与管理的影响和深化建筑工程造价咨询作用的有效策略
浓香型白酒的酒醅入窖温度对酒醅窖内发酵有重要影响,入窖温度是浓香型白酒酒醅发酵重要的工艺控制参数。利用冷风摊凉的方式控制酒醅入窖温度,探究入窖温度发酵过程酒醅的温