东盟十国新闻文本的命名实体识别

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:cat521kiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为构建东盟十国知识图谱,需要对相关文本进行命名实体识别工作。设计一种基于双向GRU-CRF的神经网络模型,对中国驻东盟十国大使馆中文新闻数据进行命名实体识别。以预训练的领域词向量为输入,利用双向GRU网络从向量化的文本中提取语义特征;再通过CRF层预测并输出最优标签序列。为了进一步改善结果,在双向GRU和CRF层之间添加两层隐藏层。在数据预处理方面,提出一种数据集划分算法,对文本进行更加科学合理的划分。在东盟十国数据集上,将该模型与几种混合模型进行对比,结果显示所提模型在人名、地名、组织机构名识别任务中拥
其他文献
职业教育如何提高其办学质量是广大职业教育者都在积极思考和探索的问题。以工作过程为导向的专业教学改革能很好地解决目前职业教育的困境。
近日,九龙坡区教委、图书馆、新华书店、电影公司联合为10万名区内中小学生发放暑期读书卡,让学生离校不离教。学生凭读书卡可到区图书馆免费借阅图书,到区新华书店购书可享受7
目的探讨沙利度胺对肝癌HepG2细胞增殖、凋亡的影响及其机制。方法将体外培养的人肝癌HepG2细胞分为对照组和观察1、2、3组,对照组正常培养,观察1、2、3组分别加入0.50、1.00
目的观察甲泼尼龙预处理对大鼠机械通气相关性肺损伤的影响,并探讨其机制。方法实验大鼠分为C组、V组、Mp1组、Mp2组、Mp3组,各20只。C组不行机械通气,自主呼吸空气4 h;V组、
随着我国图书馆事业的继续发展,图书馆工作的不断拓展,作为图书馆存在基础和发展动力的图书馆员,应进一步认识知识和信息的关系、读者的权利和义务的关系以及图书馆工作的职业价
目的探讨肺部超声对床旁血液净化左心衰合并肾衰竭患者血管外肺水(EVLW)的评估作用。方法选择急性左心衰竭合并肾衰竭患者52例,随机分为Ⅰ组24例、Ⅱ组28例。两组均给予床旁血
目的观察食管鳞状细胞癌(ESCC)组织中三磷酸腺苷结合盒转运蛋白G2(ABCG2)及p16表达变化,并探讨其临床意义。方法选取136例份ESCC组织及37例份正常食管黏膜组织(距癌组织〉5 cm),用
为提高车载双目系统户外工作性能,提出了一种车载双目系统立体匹配算法。在代价计算阶段,提出了一种3bitCensus变换,该变换提高了对局部特征的描述能力并具有较强的鲁棒性;在代价聚合阶段,提出了基于边缘截断的自适应窗口聚合算法,该算法能够根据局部特征和边缘信息自适应的调节聚合窗口,提高了算法匹配精度;在视差计算阶段,利用跳跃式视差计算方法,进一步提高了计算效率。实验证明:基于3bit-Census
关节极限及机械手臂的奇异位形的限制,往往导致协调任务失败。通过对冗余双臂机器人的研究,利用冗余手臂的自运动特性并基于梯度投影法及奇异鲁棒性求逆法完成了冗余手臂的避
利用HotDisk热常数分析仪对四氢呋喃(THF)水合物导热系数和热扩散系数进行了非原位测量。实验结果表明,温度在254.0~267.0 K时非原位测得的THF水合物导热系数为0.52~0.57 W&#