基于BLSTM的科技文献术语抽取方法

来源 :情报工程 | 被引量 : 0次 | 上传用户:houqiusheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
术语抽取是研究科技文献领域的重要技术,为进一步提高科技文献术语抽取的准确率和召回率,本文采用了基于BLSTM(Bidirectional Long Short-Term Memory)的神经网络模型。使用预先训练的词向量字典将中文分词结果映射为向量作为BLSTM模型的输入,使用序列标注的方法将输出分类结果映射为术语的边界进行术语抽取。在自动化技术、计算机技术领域的数据集上,设计实验对比了使用词为特征的BLSTM模型和条件随机场模型的抽取结果。结果表明基于BLSTM模型的科技文献术语抽取得了更优的性能,在中文数据集上精确率最高0.7821,召回率最高0.8020,F1值最高0.7860,在英文数据集上分别达到0.8525,0.8677和0.8543。
其他文献
著名教育家夏丐尊说过:“教育没有情感,没有爱,如同池塘没有水一样。没有水,就不能成其为池塘;没有情感,没有爱,也就没有教育。”对于这句话,我感触颇深。
期刊
以烧结烟气脱硫工艺为例,指出了脱硫装置的主要腐蚀部位,分析了产生腐蚀的原因,探讨了烧结烟气脱硫系统中所采用的各类防腐蚀技术、防腐材料,提出了相应的对策与建议。
本文是我一生中努力的一个总结也是一个想法,抛出来供前辈和同行参考,欢迎多提宝贵意见,便于我更好的学习,更加完善自己,为挖掘建筑的魂魄而努力。
质量是安全的保障,只有提高对水利工程施工质量的控制,才能更好地保护人民的生命财产安全。本文从水利工程施工技术的质量管理和控制出发,针对水利工程施工技术存在的质量问题,提
文章结合工程实例论述了浅埋隧道软弱围岩的监控量测的目的,量测项目,监控量测实施及要求。供业内人士参考。
在浴比100的去离子水中加入0.5%的十二烷基磺酸钠(SDS)和一定量的0.05MpH7.8的磷酸缓冲液,可以98℃下快速分离各层丝胶蛋白;在聚丙烯酰胺凝胶电泳图谱上可见丝胶Ⅰ、Ⅱ、Ⅲ的
小学生身体健康对于其成绩提高有很大作用,可是,如果疫情发生,可能会损害其健康,更别说是成绩。因此,作为学校,若是已经出现传染病,就需要加强防控,需建立专业的农村寄宿制小
在盆栽条件下,应用同位素示踪法研究稀土对水稻营养效应的影响。结果表明,水稻分药盛期和孕穗期各喷施100ppm 稀土溶液1次,可分别提高水稻吸收磷肥和土壤中磷量73.4%和32.6%;
鸡桑枝条扦插比其它桑品种容易生根,成活率高达90%以上.对鸡桑、湖桑32号、桐乡青,南一号、广东桑等枝条解剖表明,鸡桑的皮孔特别大,皮部、韧皮部、木质部均薄,髓部极大,髓射