【摘 要】
:
[目的/意义]典籍是我国传统文化、思想和智慧的载体,结合数字人文的数据获取、标注和分析方法对典籍进行实体自动识别,对于后续应用研究具有重要意义。[方法/过程]基于经过自动
【机 构】
:
南京农业大学信息科学技术学院; 金陵科技学院人文学院; 南京师范大学文学院; 南通大学经济与管理学院;
【基金项目】
:
国家自然科学基金面上项目“基于典籍引得的句法级汉英平行语料库构建及人文计算研究”(项目编号:71673143);国家社会科学基金重大项目“基于《汉学引得丛刊》的典籍知识库构建及人文计算研究”(项目编号:15ZDB127)研究成果之一
论文部分内容阅读
[目的/意义]典籍是我国传统文化、思想和智慧的载体,结合数字人文的数据获取、标注和分析方法对典籍进行实体自动识别,对于后续应用研究具有重要意义。[方法/过程]基于经过自动分词与人工标注的25本先秦典籍构建古籍语料库,分别基于不同规模的语料库和Bi-LSTM、Bi-LSTMAttention、Bi-LSTM-CRF、Bi-LSTM-CRF-Attention、Bi-RNN和Bi-RNN-CRF、BERT等7种深度学习模型,从中抽取构成历史事件的相应实体并进行效果对比。[结果/结论]在全部语料上训练得到的Bi-LSTM-Attention与Bi-RNN-CRF模型的准确率分别达到89.79%和89.33%,证实了深度学习应用于大规模文本数据集的可行性。
其他文献
<正> 如果说,1985年获得的抗除草剂转基因烟草为植物基因工程拉开了序幕,那么,10多年来,植物的基因工程已取得了令人震惊的成果。一批具有抗虫、抗病毒、抗除草剂和其他特殊
近年来,随着分子生物学的发展,有关疼痛生理学的研究已有很大进步,为联合用药奠定了理论基础.
<正> 今年6月26日,美、英、法、德、日、中等国科学家共同宣布,人类基因组工作草图已经绘出,人体全部基因的初步测序研究工作已经完成,科学家们将深入研究与各种疾病有关的基
生活环境包括我们居住、工作及文化娱乐场所,是人类一生中接触时间最长的周边环境.当人类从原始的蒙昧状态跨入文明社会,从部落发展成为村庄、城市,也就是从那时起,人类抵御
目的:对股骨髁上骨折分类、手术适应症及交锁髓内针操作要领及术后膝关节功能恢复进行研讨.方法:在X线监视下采用膝前正中切口,逆行髓内针对股骨髁上骨折内固定,术后早期功能
空腹吃糖有害——有人在感到饥饿时,往往是吃一块糖或喝一杯糖水充饥,认为这样既可保持身体热量又能顶饿。然而,英国著名生理学家安娜·哈丁经多年研究指出,空腹喝糖茶,或饮
选取岩溶地区花溪河流域为研究对象,运用δ15N-NO_3-,δ18O-NO_3-和δ18O-H_2O同位素技术和水化学分析方法,阐明了研究区地表水和地下水中硝酸盐的分布特征,并揭示其来源和形成过程,基于R语言下运行的贝叶斯模型(stable isotope analysis in R),对研究区水体中各种硝酸盐来源的贡献比例进行了定量识别,以期对以花溪河流域为代表的典型岩溶流域水体硝酸盐污染的源头
网络流量时间序列受到复杂背景信息干扰时,预测精度不高的问题,提出一种基于四阶累积量自适应特征提取的网络流量预测算法.构建网络流量数据传输结构模型,采用四阶累积量自适
由红根草(Salvia prioutis Hance)中分得三个abietane类二萜成分:红根草酮内酯(prioketolactone,1)、新红根草酮(neoprionitone,2)和二氢异丹参酮Ⅰ(dihydroisotanshinoneⅠ,3)。经波谱分析确定了它们的化学结构,其中,1,2为新化合物,Ⅰ是鼠尾草植物中首次发现的具有七元环内酯
英国前首相撒切尔夫人曾说:"欧洲在高新技术方面落后于美国并非由于欧洲科技水平低下,而是由于欧洲在风险投资方面落后于美国10年。"美国硅谷半个世纪以来的巨大成功,正是无