基于BERT多特征融合的番茄问答模型研究

来源 :信息与电脑 | 被引量 : 0次 | 上传用户:penguin669
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问句相似度计算是基于问答对的问答系统的核心任务.针对单独使用问句向量的方式来计算问句相似度的准确率较低的问题,提出一种将BERT向量、Jaccard相似度与词性权重结合的相似度计算方法.该方法使用BERT模型来构建问句的向量并计算余弦相似度值,再结合Jaccard相似度和词性权重来对句子相似度进行计算,最终将3种相似度值进行加权计算得出最终的相似度.实验结果表明,该方法能有效提高问句相似度匹配的准确率,其准确率可以达到86.6%,相比单独使用BERT模型具有更高的准确率,将其应用于番茄问答系统中具有更好的效果.
其他文献
高职院校排课管理是否合理直接影响了高等职业教育的质量,为了进一步提高教育质量和管理水平,笔者将混合量子粒子群优化算法作为研究工具,开展针对高职院校排课管理系统的优化研究.首先,根据粒子群优化算法相关理论,完成系统的总体设计和数据库设计;其次,从课表安排管理模块、课程设置模块、自动排课模块、课表查询模块、课表打印模块以及系统维护模块多个方面入手,完成对系统核心功能模块的设计;最后,对分别应用几种优化算法的系统运行性能进行测试,选出最优算法系统.测试结果表明,在混合量子粒子群优化算法的应用背景下,高职院校排课
在C语言中,超过一定字节的数据无法储存在常量和变量中,那么对数据的直接计算也就无从谈起了.笔者将介绍使用结构体定义一个数组,再利用calloc O函数实现数组内存长度动态变化,以达到储存“大数据”的目的 .通过对数组的操作实现对“大数据”的计算,为C语言数组与指针的学习和应用提供了一定的指导.
本文首先用分词工具对收集的大量语料文档进行预处理,并进行分词和词性标注;其次,编写脚本对已经词性标注的语料库按照情感词的词性进行提取,建立候选情感词库,并用候选情感词库与外部情感词库取交集得到基准情感词表再次,用Word2Vec工具对自己创建的候选情感词库进行词向量训练,参照基准情感词表,计算情感词之间的distance值;最后,比较distance值判定情感词,即值越大则词汇之间的语义相似度就越高,从而按照距离远近选择情感新词.
本文提出一种新的元启发优化算法即视觉模拟优化算法,其是通过模拟生物的视觉系统来完成搜索的新型算法.视觉模拟优化算法与遗传算法、差分进化算法、粒子群算法、模拟退火算法以及人工蜂群算法在10个基准测试函数上进行对比研究,结果显示该算法在所有测试函数中优化效果均优于其他算法.为了进一步检验视觉模拟优化算法的有效性,用其求解非线性方程组,结果显示该算法有效且优于其他对比算法.
传统的分析方法在应用中,存在对大学生消费幅度范围预测不准确的问题.为了改善传统方法存在的不足,掌握互联网金融对大学生的真实影响,本文提出一种基于多尺度边缘检测算法的互联网金融对大学生消费观影响程度分析方法,通过构建大学生互联网金融消费模型,掌握大学生的互联网金融产品支出情况,并提取互联网金融产品的峰变点,得到对应的消费观影响因素集合.采用列联检验的方式,对大学生消费结构进行统计与分析,证明互联网金融对大学生消费与消费观的形成是存在一定促进作用的.此外,通过对比实验证明,设计的方法在实际应用中,可准确预测大
信号插值处理具有样本重采样、平滑等作用,在通信、信号处理、图像处理等领域有着广泛的应用.正弦插值具有实现算法简单、精度高等特点,然而直接采用串行方式实现正弦插值,不但计算速度较慢,而且插值倍率固定,使用不灵活.笔者通过分析正弦插值的特点,结合FPGA设计的特点提出一种并行的倍数可变的插值算法.该算法能够大幅提升运算效率,而且插值倍率可变,适应性更强.
传统的防火墙技术虽然可以加密信息,但效率较低,因此设计基于DES数据加密算法的计算机信息系统保密技术.该技术能够搜索计算机中的保密信息,在此基础上基于DES数据加密算法进行数据加密,管理计算机信息密钥,从而实现计算机信息保密.实验结果表明:设计的计算机信息保密技术在面临大量数据信息时仍能保持良好的保密功能,因此具有一定的应用价值.
二维排样优化问题是指如何在一个任意形状的母板上排满任意形状的样件使母板的利用率达到最大,二维排样优化方法分为精确方法和近似方法两大类.在求解二维排样这类NP难问题时,Meta-Heuristic算法是较好的解决方案.基于此,笔者针对Meta-Heuristic算法在二维排样问题的应用,综述了多种Meta-Heuristic算法在二维排样优化领域的研究现状,分析了不同算法的性能和适应场景,并总结了发展趋势.
在网络用户逐年增多的背景下,为了在海量信息中能够准确推荐用户想要的信息,各大网站都在研究实用性强的信息过滤技术,因此提出基于关联规则的网络信息协同过滤推荐算法.首先,基于关联规则进行相似度量计算,建立关联规则关联模型,通过模型计算确认邻近值,并根据邻近值进行推荐相似性计算.其次,基于关联规则的目标函数设定,选定多函数多最优解的建立方式.最后,进行实验对比分析.实验结果表明,该算法比传统算法的推荐准确性高.
由于传统控制方法在数据传输中会分流路径导致控制大数据通信效率的路由开销过大,因此基于蚁群算法研究大数据通信效率控制方法.在构建通信网络模型的基础上划分通信中的数据传输关系,基于蚁群算法控制传输效率,完成大数据通信效率控制方法设计.实验表明,新方法能够减少路由开销,保证数据通信的稳定性.