基于多特征实体消歧的中文知识图谱问答

来源 :计算机工程 | 被引量 : 0次 | 上传用户:bigxiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统应用于人工智能、自然语言处理和信息检索领域获得了较好的效果,知识图谱问答(KBQA)作为其中的重要组成部分,是一项极具挑战性的自然语言处理任务.然而,目前常见的中文KBQA系统对于实体链接的实体消歧部分并没有给出很好的解决方法.提出一种基于多特征实体消歧的中文KBQA系统,通过结合实体自身的知名度特征、问句与实体关系的语义相似度特征、问句与实体的字符相似度特征和语义相似度特征,构建多特征实体消歧模型,提高实体链接准确率,为系统的问句分类和最优路径选取部分提供更准确的主题实体,从而提升系统性能.实验结果表明,该系统在CCKS2019-CKBQA评测数据的验证集上平均F1值为72.08%,其中采用多特征消歧模型的实体链接准确率达到90.84%,较使用知名度消歧模型和评测大赛第1名分别提升6.35和0.11个百分点.
其他文献
含光源影响的雾图像中光源极易引入雾天原本不存在的光晕,从而影响大气光值和透射率估算的准确率,针对此问题,提出一种简单、易实现的去光源影响的雾天图像去雾算法.首先,基于超像素分割在CIELab颜色空间进行光源区域确定;然后,引入基于距离度量的光衰减因子计算并去除光源的影响;最后,以超像素块为单位估计大气光值,并采用加权导向滤波迭代优化透射率获得光源影响下的去雾结果图,提高效率和准确率.在光源影响下雾图集合和SOTS等数据集上进行了复原实验,将雾天图像复原结果与现有主流算法复原结果进行主客观对比,实验结果表明
针对沥青路面裂缝检测中富纹理噪声影响和细小裂缝误识别严重等问题,提出一种邻域与梯度显著特征融合的沥青路面裂缝检测方法.首先采用灰度校正和形态学重建降低外界干扰和富纹理中较亮点状噪声导致亮度不均的影响,根据像素及其邻域的显著差异提取邻域显著特征,通过方向可调滤波器得到不同方向上的梯度显著特征,将两者卷积融合并优选方向生成特征融合显著图;然后对特征融合显著图阈值分割得到疑似裂缝聚集区域,结合聚集区域的不同几何特征引入聚类分析法筛选裂缝候选区域;最后提出区域端点搜索与定位法,剔除无端点聚集区域的子集,并连接不同
特征匹配是从图像恢复三维模型的关键步骤之一.为有效地提高三维重建的质量,提出一种面向三维重建的增强运动一致性与引导扩散特征匹配算法.首先在基于网格的运动统计算法基础上,通过增加阈值 β,提出一种增强运动一致性概念,增强真假匹配点的判断条件,避免高相似特征点的误匹配,提高了初始匹配点的正确率;然后结合RANSAC算法进行特征点匹配优化,过滤掉异常值,进一步提高特征点匹配的准确性;最后将引导匹配和运动一致性相结合,提出一种引导扩散概念,减少了集中分布在图像局部的可能性,进而提高特征点匹配数量和三维模型的稳定性
针对多阈值图像分割中阈值求解效率低、精度不足的问题,提出了一种基于改进状态转移算法的图像多阈值分割方法.改进状态转移算法的伸缩变换采用一种方差自适应的正态分布策略,增强了算法在初期包含全局最优解的可能性,以及算法在后期的收敛性.另一方面,通过精英解集加权和来确定邻域中心,增加了群体间的交流,能充分利用精英解集间的信息实现启发式搜索,同时“贪婪准则”最优解保留机制保证了算法的收敛.实验表明,相比其它算法,上述方法在收敛效率和精度方面有显著优势.
针对视障人士出行辅助中可通行区域地面障碍物实时检测问题,提出一种基于RGB-D和惯性传感器融合的地面障碍物检测技术.首先建立地面障碍物空间模型,并融合惯性传感器参数计算相机倾角以校正地面障碍物世界坐标;其次针对视障人士实际使用场景和需求,使用阈值分割算法将深度图像中距离较远的检测像素去除,并将深度图划分4个区域,通过融合惯性传感器数据实现ROI的动态划分;最后通过改进RANSAC算法设计了基于地面区域生长的障碍物检测算法,并采集真实数据进行实验验证.实验结果表明,所提技术的准确率和召回率分别达到90.87
垃圾分类是保护生态环境、促进经济发展的有效措施,利用深度学习进行垃圾分类已成为当前学术界和工业界的研究热点.传统垃圾分类主要由人工进行分拣和分类,存在劳动强度大、分选效率低、工作环境差等缺点,急需智能化、自动化的分类方法来替代.近年来研究人员已经开始初步探索利用深度学习技术进行垃圾分类并提出一些有效的方法.从方法、数据集和研究方向等方面分析深度学习垃圾分类方法的研究现状,介绍不同深度学习模型在垃圾分类中的应用和发展,研究基于ResNet方法、基于DenseNet方法、基于单阶段目标检测方法和基于卷积神经网
针对传统的IDS规则更新方法基本只能提取已知攻击行为的特征,或者在原有特征的基础上寻找最佳的一般表达式,无法针对当前发生的热点网络安全事件做出及时更新,提出基于威胁情报的自动生成入侵检测规则方法.文章分类模块使用Word2Vec进行特征提取,利用AdaBoost算法训练文章分类模型获取威胁情报文本;定位IoC所在的段落并使用条件共现度算法进行特征扩展和子文档重构,使用深度学习算法ResLCNN提取文章中的IoC数据;将所提取的IoC数据转化为入侵检测规则.通过对最新恶意代码流量数据进行测试,该方法对新发现
随着网络安全技术的更新迭代,新型攻击手段日益增加,企业面临未知威胁难以识别的问题.用户与实体行为分析是识别用户和实体行为中潜在威胁事件的一种异常检测技术,广泛应用于企业内部威胁分析和外部入侵检测等任务.基于机器学习方法对用户和实体的行为进行模型建立与风险点识别,可以有效解决未知威胁难以检测的问题,增强企业网络安全防护能力.回顾用户与实体行为分析的发展历程,重点讨论用户与实体行为分析技术在统计学习、深度学习、强化学习等3个方面的应用情况,研究具有代表性的用户与实体行为分析算法并对算法性能进行对比分析.介绍4
由于难以构造通用的认证结构对图像类型数据的相似度计算过程进行验证,因此对加密图像检索结果的验证面临很大挑战.同时,现有多数加密图像检索方案没有考虑恶意云服务器的问题,可能返回不正确或不完整的检索结果.利用区块链技术的去中心化、不可篡改等特性,提出一种基于区块链可验证的加密图像检索方案BVEIR,确保搜索结果的可靠性与搜索过程的透明性.将加密索引存储在区块链(以太坊)上,通过区块链的共识机制保证在智能合约上完成搜索的功能,确保搜索结果完备性,同时将相应的加密图像数据外包到云服务器以降低存储成本,并在相似图片
知识图谱采用RDF三元组的形式描述现实世界中的关系和头、尾实体,即(头实体,关系,尾实体)或(主语,谓语,宾语).为补全知识图谱中缺失的事实三元组,将四元数融入胶囊神经网络模型预测缺失的知识,并构建一种新的知识图谱补全模型.采用超复数嵌入取代传统的实值嵌入来编码三元组结构信息,以尽可能全面捕获三元组全局特性,将实体、关系的四元数嵌入作为胶囊网络的输入,四元数结合优化的胶囊网络模型可以有效补全知识图谱中丢失的三元组,提高预测精度.链接预测实验结果表明,与CapsE模型相比,在数据集WN18RR中,该知识图谱