基于神经网络的命名实体识别技术研究及应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:y51211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能电视机的出现突破了传统有线电视机的局限,通过联网就能实现看网络视频、听音乐、玩游戏、安装各种软件、KTV功能、网络视频电话、看天气等一系列多媒体功能。但是用一个遥控器来操控智能电视机的诸多功能是很不方便的,通过语音操控电视机,这会大大提升用户的观看体验。本文基于TCL下一代智能电视机的人机语音交互系统进行研究,致力于实现其中的命名实体识别系统。论文的主要工作如下:(1)通过分析命名实体识别系统,根据用户需求的多样性,提出了基于卷积神经网络的场景文本分类来得到业务场景,应用于命名实体识别以提高模型识别的准确率。从网上爬虫得到的原始数据不能直接用于网络训练,需要经过数据预处理,本文设计的场景文本分类模型包括输入层、特征提取层、合并层、输出层,输入层包括词向量和字向量两种方式,分别进入对应的特征提取层得到特征向量,特征提取层的卷积层和池化层交替进行,合并层把通过词向量和字向量得到的特征向量拼接起来,输出层包括全连接层和Soft Max层,对合并层得到的特征向量进行业务分类。为了验证分类模型的性能,本文通过对比实验得到的分类准确率达到了0.9991。(2)通过场景文本分类模型得到了业务场景,根据具体业务场景调用对应的NER模型,为了得到NER模型,本文提出了基于Transformer网络和循环神经网络的复合框架来实现命名实体识别。基于复合框架的NER模型包括输入层、Transformer层、循环神经网络层、输出层,输入层主要是通过随机编码和位置编码拼接的方式生成Embedding向量,Transformer层的多头Self-Attention机制能并行计算,从而加快网络训练速度,并且能学到句子级别的序列表征,循环神经网络层的循环迭代的记忆特性使得它能够很好地学到字级别的上下文语义信息,提高模型准确率,输出层包括全连接层和CRF层,全连接层能够把循环神经网络层的结果映射到标签字典维度上,CRF层能够通过自动学习实体标签的约束来提高命名实体识别的准确率。为了验证复合框架在NER模型上的性能,本文通过在复合框架、Transformer网络、循环神经网络这三种网络上设计了对比实验,通过实验结果证明了本文提出的复合框架能保证准确率和训练时间。(3)根据上述的场景文本分类模块和命名实体识别模块,本文设计与实现了基于Django框架的命名实体识别系统,通过对面向智能电视机的命名实体识别系统的的需求分析,进行了需求建模,通过用例图以及用例描述介绍了每个用例具体的业务流程,整个系统的功能分解为场景文本分类模块和命名实体识别模块,针对每个模块进行了功能设计以及阐述了每个功能的作用,在设计与实现过程中通过流程图进行了介绍,并展示了系统实现界面,为了验证系统功能,进行了系统测试,介绍了系统使用的测试环境和测试数据集,根据测试结果编写了测试用例,结果显示需求设计的功能全部符合。通过输入若干条文本序列,系统都能预测出其中包含的命名实体,所有的评估结果都正确,表明模型可用于实际。
其他文献
对于冗余机械臂而言,关节重复性运动是考察其运行性能的一个重要标志。在工业工程实践中,装配、电焊、喷涂以及其它应用于特定环境下的机械臂,需要机械臂自身具有多余的自由
稀土离子掺杂的发光材料具有许多优异的性能,如光吸收能力强,色纯度高,色彩鲜艳,发射波长覆盖范围广,物理化学性能稳定等优点,因此在照明、生物医学成像、防伪、温度传感、太阳能电池、数据存储和3D显示等领域受到了广泛关注。近年来,玻璃基质的高透明度、低成本、易加工的特性使得稀土掺杂的发光玻璃在温度传感器、白光LED器件等方向表现出巨大的潜在应用的可能。考虑到氟氧化物微晶玻璃兼具氟化物和氧化物的优点,既满
20世纪90年代以来,经济全球化飞速发展,贸易引致的空间格局也发生了明显的变化。在此进程中,中国的对外贸易也不例外,经济开放政策使贸易总额突飞猛进,占世界总贸易额的比例不断上升。中国地处欧亚大陆关键地带,与中亚邻国具有独特的地缘战略优势。2012年,习近平主席提出的“一带一路”倡议途径中亚五国,成功的发掘了中亚市场的巨大潜力,商品贸易作为国家间基础经济合作内容,必将成为丝绸之路经济带的重点合作领域
在对中美两国在几内亚湾海域安全动态研究中所扮演的角色进行深入分析之前,必须阐明其中的一些关键词和表述,以便更好地理解。从地理概念上讲,海湾可以被定义为海洋的一部分,一部分被陆地包围,或者是一个几乎被陆地包围的大海湾。根据这个定义,几内亚湾可以被理解为大西洋的一个大海湾,形成了一条大约由25个西非和中非国家组成的长长的海岸线,从安哥拉延伸到塞内加尔,其中包括喀麦隆、赤道几内亚、加蓬、加纳、尼日利亚、
本论文主要研究以铯铅溴(CsPbBr3)为主体的绿光钙钛矿发光二极管(Light-Emitting Diode,LED)。无机钙钛矿 CsPbBr3本身具有较高的稳定性,因此可以 用于制备高效稳定的钙钛矿LED。目前,基于CsPbBr3钙钛矿的发光器件发展迅速,但是,CsPbBr3本身仍存在诸多问题限制着其发光效率的进一步提高。三维CsPbBr3本身存在着大量的缺陷态,并且结晶度较低,成膜质量较差
PZT基压电陶瓷材料因为其优异的压电性能被广泛应用于日常生产生活和军工中,如换能器、制动器、马达等。但是PZT基压电陶瓷在烧结过程铅容易挥发,会污染环境,对人的身体健康不利。为了发展对环境友好型的压电陶瓷材料,研究人员致力于研发出一种无铅压电陶瓷材料来取代PZT基压电陶瓷材料。BCZT压电陶瓷是一种新型的二元系陶瓷,在其准同型相界(MPB)附近具有较高的压电性能,其压电性能能够和PZT基压电陶瓷相
美俄关系是当今世界最重要的双边关系之一,两国关系的发展及双方政策走势对整个世界带来深远的影响。只有了解美俄关系变化的原因,科学分析他们解决国际问题时的思路和方法,并加以学习和借鉴,才能够有效地解决国际争端,维护世界的和平与安定。奥巴马就任总统后,美国开始重启美俄关系,由此带来美俄关系的新变化。2009年到2016年,奥巴马八年任期中美俄关系经历了重启到恶化,再到对峙。在现有国家双边关系理论中,国家
目的:磷酸二醋酶(phosphodiesterase,PDEs)是一类多基因大家族酶,至少包括11个家族22个亚型,负责水解细胞内环磷酸腺苷(cAMP)和环磷酸鸟苷(cGMP)多种信号传递和生理活动。PDE4对细胞内cAMP浓度及其下游信号传导具有重要的调控作用。近年来,PDE4抑制剂在治疗哮喘,慢性阻塞性肺疾病(COPD)以及脊髓损伤,阿尔兹海默病等中枢神经系统损伤中发挥了重要作用。天然产物一直
癌症严重威胁着人类的健康和生命,引起人们的极大关注。科学技术的发展与进步也使人们对癌症的了解逐步加深。皮肤癌是一种相对普遍的癌症,如果能够提早发现并及时进行治疗,在很大程度上能有效缓解患者的痛苦甚至能够完全治愈。荧光寿命成像显微技术(FLIM)能够揭示荧光分子所处微环境的变化,准确反映细胞和组织的代谢状态,通过对其进行高分辨率成像,实现生物细胞和组织的结构与功能地精确表征,为生物医学的研究提供了一
如今,随着微波技术和信息技术的发展,人们对通信容量增加的需求日益提高。在微波通信向高频率信号通信方向发展的同时,有一些难题也随之产生:一是微波信号的频率带宽有限,因此制约了微波通信进一步的发展;二是极短波长的高频特性信号在远距离传输时损耗严重。对于传统的电域滤波器,其带宽和采样频率受限,所以只能对低频特性信号实现滤波处理,这易引起电磁干扰,当所处理的微波信号的频率发生变化时,其滤波电路需重新设计来