【摘 要】
:
传统搜索引擎在查询网络数据时,返回的往往都是包含许多噪声的数据,查询效率低下。随着人工智能技术的发展,自动问答系统逐渐成为新的人机交互方式。知识图谱的出现为自动问答系统提供了更加精准的答案来源,基于知识图谱的问答系统也成为一个研究热点。然而,由于中文文本的表现形式复杂多样,传统的知识问答方法很难运用到大规模的中文知识库问答系统中。为提高中文知识问答系统的准确率,本文以开放域中文知识图谱为知识来源,
论文部分内容阅读
传统搜索引擎在查询网络数据时,返回的往往都是包含许多噪声的数据,查询效率低下。随着人工智能技术的发展,自动问答系统逐渐成为新的人机交互方式。知识图谱的出现为自动问答系统提供了更加精准的答案来源,基于知识图谱的问答系统也成为一个研究热点。然而,由于中文文本的表现形式复杂多样,传统的知识问答方法很难运用到大规模的中文知识库问答系统中。为提高中文知识问答系统的准确率,本文以开放域中文知识图谱为知识来源,将中文知识问答系统划分为实体抽取和属性映射两个关键步骤。首先,针对实体抽取阶段传统命名实体识别方法的不足,本文通过改进后的BiLSTM-CNN-CRF模型进行问句命名实体识别。模型利用CNN提取局部信息的优点和LSTM提取时序信息的优点共同对问句进行编码,提高问句实体识别的准确率。此外,针对实体链接不准确的问题,本文使用编辑距离进行优化。其次,针对属性映射阶段传统方法的不足以及问句和候选属性自身的特点,本文设计并实现Multi-Granularity based Attentive LSTM and CNN(MGBA-LSTM-CNN)模型,从不同层次对问句和候选属性进行编码,然后使用余弦距离计算问句语义向量和候选属性语义向量的相似度,找到与问句最相似的知识三元组,从而找到最终答案。最后,本文使用实体抽取与属性映射两部分的最优模型实现中文知识问答原型系统,该系统可以精确回答用户提出的自然语言问句。同时,本文使用公开数据集对系统进行测试,结果表明本文设计的相关模型以及系统是有效可行的。
其他文献
Zig Bee无线传感器定位系统广泛应用于便携式穿戴设备定位,受穿戴设备信号传输距离限制,定位需依赖大量锚节点(AN)。前期部署和后期维护AN需要做大量的工作。Wi-Fi定位系统无需提前部署AN,但是Wi-Fi接入点(Wi-Fi AP)功耗高,不适合作为便携式穿戴设备。新兴的跨技术通信(CTC)技术让使用Wi-Fi AP完成Zig Bee节点定位成为可能。首先,本文设计一款无需提前布置的AN的未知
伴随着工业技术的不断创新与发展,工业生产中对单电机的控制已经无法满足现代工业发展的需求。很多领域都需要多台电机互相配合完成生产实践。多电机协同同步控制成研究与应用的热点。目前多电机同步控制具有非线性、强耦合、时变、高阶、多变量特点,电机同步控制存在抗干扰能力差,系统受到外界扰动时难以快速恢复到设定值,跟踪性能较差问题。本文围绕着单电机矢量控制、多电机耦合结构下同步控制及在外界干扰情况下如何保证稳定
本文利用不同希尔伯特空间的粒子构成的非对称量子通道,进行了多方和控制量子密集编码的研究,在多个传送者一个接收者的量子密集编码方案中,本文提高了传送的经典信息量;通过借助投影测量,实现了一个传送者多个接收者的量子密集编码方案,在控制量子密集编码方案中,我们利用非对称的多体纠缠态,给出了一种量子控制经典信息量的方法,调控经典信息量在粒子信息容量和量子信道容量之间浮动。
心血管疾病Cardio-Vascular Disease(CVD)是全世界主要的死亡原因之一,预计到2025年将有2360万人受到CVD的攻击。因此,医疗保健行业的建立旨在收集大量的心血管疾病CVD信息,通过对这些信息的挖掘分析以帮助医生检测和识别CVD的潜在危险因素。Deep learning algorithms可以根据这些结构化和非结构化的病例信息来帮助发现疾病和症状的潜在模式。在流行病学中
骨髓间充质干细胞(BMSCs)具有强大的增殖能力及多向分化潜能,而中医"肾藏象理论"认为肾藏精,精能生髓,髓能养骨、充脑,且可化生天癸,主宰生殖,二者在主宰机体的生理活动和病理变化方面有着诸多相似之处。现代研究表明补肾中药能促进BMSCs增殖并诱导其定向分化为成骨细胞、神经细胞、生殖细胞,基于补肾中药干预BMSCs增殖分化的研究现状来探讨其与"肾藏精"、"肾主骨"、"肾生脑"、"肾主生殖"等中医"
对PM2.5浓度造成影响的因素有很多,导致PM2.5浓度的表现形式复杂而多变。如何对PM2.5浓度及其相关影响因素进行分析,找到内部存在的规律,进而实现对PM2.5浓度进行预测,对于改善居民空气质量、促进人民健康发展都具有及其重要的意义。通过以北京市污染物浓度、气象数据作为研究对象,提出一种基于相关性递归SVM的PM2.5浓度预测神经网络模型,该方法充分考虑空气质量演变特征的动态关联关系,从而提高
本文提出了多方参与概率隐形传送任意未知多粒子态的方案.首先,利用一个三粒子非最大纠缠Greenberger-Horne-Zeilinger(GHZ)态和一个二粒子非最大纠缠态作为量子通道,提出了三方参与概率隐形传送任意未知二粒子态的方案。然后,利用一个三粒子非最大纠缠GHZ态和两个二粒子非最大纠缠态作为量子通道,提出了三方参与概率隐形传送任意未知三粒子态的方案,最后,将这两个方案进行推广,首先推广
本文提出了以非对称多体态作为量子通道密集编码方案,所谓非对称量子通道就是接收者和发送者所拥有的粒子处于非对称的希尔伯特空间。首先提出了非对称多体量子通道为最大纠缠态时的密集编码方案,并且比较了非对称量子通道与对称量子通道所传的信息量;然后又提出了非对称多体量子通道为非最大纠缠态时的几率性密集编码方案,还讨论了平均信息量与组成量子通道的非最大纠缠态系数之间的关系。
在线社交网络的发展使得信息的传播速度更快、范围更广,因此研究信息传播机制变得十分重要。由于传统的SIR模型具有如下局限性:易感染节点被信息影响的概率是一定的,无法根据节点自身环境做出变化;整个信息传播过程过于理想化,网络中的节点可以实时接收信息。基于上述传统模型的局限性,本文提出了新型的信息传播模型并研究了信息间的关系对于信息传播过程的影响。本文主要工作如下:首先,基于热传递思想提出了一种HT(H
数学作为初中阶段的一门基础学科,受到教师和学生的广泛关注。在新课程改革背景下,培养学生的学科核心素养是重要的教学内容之一。而单元整体教学对培养学生的思维能力及学科核心素养十分有利。单元整体教学是指以多课时单元为基本单位,对单元中的所有知识进行概括和总结,找出重难点进行教学。在初中数学教学中,单元整体教学常用于复习阶段,并取得了非常好的效果。基于此,教师应加强对单元整体教学在初中数学课堂中的运用探究