基于Capsule-BiGRU的文本相似度分析算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lialianing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统神经网络模型不能很好地提取文本特征的问题,提出基于capsule-BiGRU的文本相似度分析方法,该方法将胶囊网络(capsule)提取的文本的局部特征矩阵和双向门控循环单元网络(Bi GRU)提取的文本的全局特征矩阵分别进行相似度分析,得到文本的相似度矩阵,将相似度矩阵融合,得到两个文本的多层次相似度向量,从而进行文本相似度的判定。将传统的胶囊网络进行改进,把与文本语义无关的单词视为噪声胶囊,赋予较小权值,从而减轻对后续任务的影响。针对文本相似度的任务,在文本特征矩阵提取前加入互注意力机制,对于
其他文献
将信息技术与海工建造质量管理体系相结合,基于企业微信管理平台,利用C#开发语言,设计了一套集报验管理、意见管理、探伤管理、焊工管理、WPS管理、材料追溯、完工状态跟踪、完工文档等功能模块一体的海工建造质量管理系统。实际应用证明:数据准确性从原来的90%左右提高至99%以上,质量的合格率由原先的90%提升至95%以上,提高了海工建造管理的精益化水平,实现了海工数字化管理。
Strongly acidic wastewater produced in nonferrous metal smelting industries often contains high concentrations of Ni(Ⅱ), which is a valuable metal. In this study, the precipitation of Ni(Ⅱ) from strongly acidic wastewater using sodium dimethyldithiocarbam
针对现有会话推荐算法未充分考虑用户的上下文信息的现状,为增强基于会话的推荐算法的个性化推荐效果,提出一种融合用户会话数据的上下文感知推荐算法。将上下文信息通过embedding映射成低维实数向量特征,通过Add、Stack、MLP三种组合方式将低维向量特征融入到基于会话的循环神经网络推荐模型,设计了基于BPR的损失函数动态刻画会话点击序列的用户偏好,以提升个性化推荐能力。在Adressa数据集上的实验表明,所提算法相比基线算法GRU4REC,在指标Recall@20上提高了3.2%,MRR@20上提高了2
针对集装箱箱号图像中存在的光照不均、箱号的偏转和倾斜等因素,着重研究箱号字符识别中的关键技术问题。对于箱号图像光照不均问题,采用一种改进型的差分边缘检测粗定位算法;利用改进的最小二乘法有效地解决箱号偏转难以精确定位问题;运用基于梯度下降投影字符矫正及分割算法,实现对倾斜箱号的校正与分割;采用BP神经网络进行字符识别。对1 050幅不同条件的拍摄图像进行实验,结果表明上述算法相对于传统算法与深度学习
知识图谱是真实世界三元组的结构化表示。通常,三元组表示形式为(头实体,关系,尾实体),这表示头实体和尾实体通过特定关系相互联系。针对知识图谱中广泛存在的数据稀疏问题,提出一种球坐标建模语义分层的知识图谱补全方法。使用球坐标系对实体和关系进行建模表示,以进行链接预测。具体来说,半径坐标旨在对不同层级的实体进行建模,半径较小的实体级别越高;角度坐标旨在区分相同层级的实体,即模长相等而角度不同的实体。该方法将实体映射到球坐标系中,可以有效建模知识图谱中普遍存在的语义分层现象。实验中,采用公开数据集WN18RR、
Under the background of global warming,the summer temperature of the North and Northeast China(NNEC)has significantly increased since 2017,which was accompanied by the aggravated ozone(O3)pollution.In 2018,the NNEC experienced a record-breaking
全比较计算数据分发策略是提高分布式集群系统整体计算性能的关键。针对现有数据分发策略存在的计算负载不均衡、数据不能完全本地化、存储空间浪费和计算速度慢等弊端,在满足数据完全本地化的前提下以负载均衡、最优化存储作为优化目标,结合优化的粒子群算法提出了数据分发模型(Data Distribution Based on Particle Swarm Optimization,DDBPSO)。DDBPSO模型分别以任务扰动、交换任务的方式对粒子进化规则进行了优化,有效避免了算法陷入局部最优。通过计算负载、存储占用和
Coagulation-based pre-treatment efficiency of high strength digestate of food waste(HS-DFW)anaerobic digestion is negated by organic ligand-catalyzed decomposit
工业机器人作业过程中普遍需要较高的能耗。基于量子行为和差分进化的改进蜻蜓算法,实现能耗约束下优化工业机器人避障作业轨迹。基于工业机器人五次B样条曲线矩阵式和动力学模型,构建能耗约束模型;进行仿真实验,利用改进蜻蜓算法求解能耗约束模型为适应度评价函数的工业机器人轨迹,对比改进蜻蜓算法与原始蜻蜓算法和基于指数函数步长的精英反向蜻蜓算法的优化结果,表明改进蜻蜓算法具有更优的性能。
图概要技术是管理、分析和可视化大规模图的关键技术之一。如何综合结构和属性信息进行图概要是一个挑战。大部分现有的图概要方法或者只考虑结构或属性某一方面的信息,或者要求属性的表现形式是一致的。结合信息论中最小描述长度原则,对属性图概要问题建模,将其转化为求解最小表示代价问题,以实现图压缩和图概要的双重目标。提出了一种计算节点属性相似性的方法,该属性度量方法对节点属性的限制较小,并且将节点间的相似性统一为存储代价,实现了节点结构相似和属性相似的协同考虑。提出了两种求解最小代价表示的图概要算法。在真实和合成的数据