【摘 要】
:
信息技术的高速发展,带来了数据量的爆炸式增长。问答系统的出现让人们可以通过计算机从海量的数据中直接获取需要的答案。作为问答系统一直以来的研究热点,答案选择类问答系统通过对部分符合要求的信息进行筛选和排序的方式来选择输出的答案。针对当前研究中自然科学场景缺失、逻辑推理能力不足和特征信息权重分配不合理等问题,本文的工作内容如下:(1)本文采用基于注意力机制的长短期记忆模型(Attention-base
论文部分内容阅读
信息技术的高速发展,带来了数据量的爆炸式增长。问答系统的出现让人们可以通过计算机从海量的数据中直接获取需要的答案。作为问答系统一直以来的研究热点,答案选择类问答系统通过对部分符合要求的信息进行筛选和排序的方式来选择输出的答案。针对当前研究中自然科学场景缺失、逻辑推理能力不足和特征信息权重分配不合理等问题,本文的工作内容如下:(1)本文采用基于注意力机制的长短期记忆模型(Attention-based LSTM)用以优化科学考试场景下的答案选择类问答系统,其优势在于将复杂的信息检索问题转换成二分类问题。该模型可以根据问题从多个候选答案中选取最符合题意的答案,在不借助外部知识库的情况下,对英文和中文不同数据子集分别取得35.3%和46.5%的准确率。(2)本文采用基于注意力机制的卷积神经网络和长短期记忆的组合模型(Attention-based CNN-LSTM)用以优化阅读理解场景下的答案选择类问答系统,其优势在于利用知识库来提升问答系统的逻辑推理能力。该模型借助给定的问题和相关的知识文本,从2个候选答案中找出正确答案。实验结果表明,该模型的分类准确率达到711.4%。(3)本文提出了一种基于TF-IDF权重的双向长短期记忆模型(TF-IDF Bi-LSTM)用以解决注意力机制信息权重分配不合理的问题,充分考虑词频和逆文档频率两个因素对特征信息的贡献。该模型将科学考试场景的英文和中文数据子集的分类准确率提升到41.2%和52.3%。同时在阅读理解场景的数据集上,准确率提升到78.3%,最后通过模型集成的方式将准确率提升为81.1%。
其他文献
目标检测技术是一种识别并定位图像中特定目标的技术,它是图像理解的一个重要环节,一直以来都是国内外学者的研究热点。随着卫星技术的发展,尤其是高分三号等卫星的发射,大量
键值存储是现代存储系统的重要组成部分,由于LSM-tree数据结构针对磁盘的随机写做了优化,大幅度提升了键值存储系统的写性能,因此基于LSM-tree的键值存储成为主流。为了克服LSM-tree在读写操作中仍然产生较高的读写放大现象,进一步发展成为采用键值分离的键值存储系统。然而,采用键值分离的键值存储系统在更新密集型工作负载下会频繁的触发垃圾回收(GC)操作,导致其无法实现较高性能。针对上述问题
获取数字图像中物体的深度信息,即物距离相机的远近关系,是机器视觉学科一项重要的任务。图像的深度信息一般表示成对应图像的深度图,深度图中每个像素的灰度值代表原图对应像素到相机所在平面的距离。获得的深度图是二维图像进行三维重建的基础,同时也为图像的分割、聚类、识别等提供了新的途径。图像的深度信息还是工业生产实现自动化的重要基础,也是机器人、无人机、无人车等智能机械实现自动寻径、自动规避等功能的重要依据
外控式变排量压缩机开发项目的进度计划及控制一直以来是研发项目管理的重要一环。对于研发经理和项目团队来说,此类项目经常会出现计划赶不上变化的情况,开发团队对进度计划和控制的把握往往不尽人意。主要原因在于这种压缩机的的开发项目具有不确定性。以往在企业中使用的项目进度管理方法缺少对这种不确定性的考虑,所以进度计划无法完全反映研发压缩机项目的实际情况,这样给项目资源配置、人员投入、生产准备、市场开发都带来
全球气候变化引发人们对低碳经济与低碳创新发展的空前重视,向低碳经济转型成为各国区域经济发展的新趋势。区域创新系统是区域经济可持续发展的驱动力。目前,我国现有的区域
黄土高原地区地处我国西北内陆,自然环境恶劣,是我国水土流失最为严重的地区。严重的水土流失制约着社会经济的绿色持续发展,导致贫穷和环境问题日益严重。因此,在黄土高原地
本文以具有耦合时滞的弹性关节机械臂系统为研究对象,建立四维系统模型,通过引入快慢变因数,研究退化后其二维子系统的稳定性,分析时滞因素对系统的非线性振动的影响。首先对
伴随着移动互联网、物联网和云计算等信息技术的飞速发展,数据量呈爆炸性增长,多样化的大数据应用对存储系统的性能和可靠性提出了更大的挑战。基于闪存的固态盘(Solid State Drive,简称SSD)因具有高性能、高可靠性、低能耗等特性成为主流存储设备,被广泛应用于嵌入式设备、个人电脑、企业存储系统和数据中心中。如何降低闪存的磨损写和异地更新等特征对闪存存储设备的性能和寿命的影响,成为了研究的热点