基于交互注意力网络的校园问答研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:shan12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
校园生活中,每天都会产生大量的问题,信息获取的方式主要采用搜索引擎和信息化服务,传统的搜索引擎主要是基于关键词搜索并且伴随着返回大量无关信息,用户体验不佳,同时传统的信息化服务没有统一信息查询的入口,无法满足用户高效获取信息的需求。自动问答是一种新颖的信息获取方式,快速且精准地回答用户的问题,将自动问答应用到校园领域中,可以通过设计校园问答系统,提供咨询的统一入口,返回精准的信息,为用户提供便捷的信息化服务。校园问答的核心部分是将问题和问答库进行匹配得到答案信息,而次要部分是对问题进行类别分析,减少匹配的任务量。因此,本文主要从文本匹配和问题分析两个方面对校园问答进行研究,主要工作如下:(一)研究了用于校园文本匹配的语义匹配算法。目前的研究只从词或字的角度对校园领域的中文文本进行分析无法获取准确的语义表示。针对特征的表示和学习,本文从词、字和位置的角度对文本进行混合表示,同时结合注意力网络的优势,对各个特征之间的关系进行交互学习,提出了一个基于交互注意力网络的语义匹配模型(Interactive Attention Network Semantics Model,IANSM)。首先从词和字的角度对文本进行表示,其次通过位置编码和长短期记忆网络对词和字的表示进行编码学习,获取文本的混合表示,然后构建交互注意力网络学习文本特征的关联信息,最后构建分类器得到匹配的结果。(二)研究了用于校园问题分析的短文本快速分类算法。校园问答任务实质上是根据问题,从一个问题集中得到匹配度最高的相似问题,问题集的数量很大程度上影响了问答的效率。校园问答过程中如果先对问题进行分类,通过问题的类别从问答库中获取同类别的问题进行语义匹配,可以减少待匹配的问题数量,所以本文提出了一个基于自注意力网络的短文本快速分类模型(Self Attention Network Classification Model,SANCM)。首先通过N-gram学习特征的语序信息,然后构建自注意力网络聚焦重要的特征,减少冗余特征对分类任务的影响,最后构建分类器得到分类的结果。(三)构建校园领域的数据集。目前没有针对校园领域的公共数据集,因此本文通过爬虫技术抓取论坛和贴吧的相关数据,参照其他高质量且开源的数据集对数据进行完善和标注得到了校园常见问题对数据集,并将该数据集用于校园文本匹配的研究。针对校园文本分类的研究,本文对抓取的数据进行类别标注,得到了校园常见问题数据集。两个校园领域数据集的构建,为本文的研究提供数据支撑。(四)校园问答系统的设计和开发。本文结合IANSM模型和SANCM模型完成校园问答任务,首先使用SANCM模型对用户的问题进行分类,然后根据类别从问答库中获取同类别信息,最后将用户的问题和信息输入到IANSM模型进行匹配得到答案并返回给用户。同时该系统还提供了历史记录、收藏记录等个人信息的查看功能,热点问题的阅览功能以及知识扩充功能。
其他文献
学位
学位
学位
学位
学位
学位
在各种领域中,愈来愈多的目光都开始聚集于女性的身上,这意味着对女性在社会中的审视与观察从未停止,这些在现实中对女性的聚焦,更是被赤裸裸地体现在了影像中。女性不仅在摄影的道路上经历了从被观看到观看的转变,而且女性身份在影像之路上也一直被探索着。身份的建构是摄影作品观念性表达的重要形式之一。从观看方式的不同到传播价值的研究,都体现了女性身份的建构在当代摄影中的至关性。在此针对当代摄影艺术中女性身份的相
移动型机器人作为机器人技术的典型代表,能够在探险救灾、资源探查、军事打击以及管道检修等复杂恶劣的环境下代替人类执行危险的作业任务,具有极高的研究意义和广阔的应用需求。为解决传统的单模式移动型机器人的模式单一、运动性能不足等问题,提高机器人在非结构化环境下的越障能力和适应能力,满足不同地形环境下的运动需求。本文以轮腿变形机制作为研究切入点,在三自由度两栖运动推进机构e Paddle(Eccentri
文物类等脆弱物品的日常展示、存放或搬运过程易受外界环境因素的影响,如环境温度升高或辐照侵蚀,若文物表面或内部存在微小的叶尖裂纹,外界环境因素会加剧裂纹的生长,从而造成文物的进一步损伤。因此检测文物等脆弱物品中微小叶尖裂纹并掌握其在不同外界环境因素影响下的生长规律具有重要的意义。在微观参量检测中,数字全息技术有着独特的优势,如非接触、高精度、实时、快速等。本论文以数字全息技术为手段,针对常用于油画类
在铝合金铸造与回收过程中,铁元素一般作为杂质元素存在,随着凝固过程的进行而形成粗大硬脆的铁金属间化合物,该析出相一般会降低合金的机械性能,是裂纹萌生和材料断裂的主要位置。研究者通常利用控制冷却速率、添加微量元素等方式来调控铁金属间化合物的析出,进而改善铝合金材料的性能。磁场作为一种无接触的方法,广泛用于对金属凝固过程微观组织结构形成进行调控,然而利用磁场改善铝合金中铁金属间化合物析出行为的研究还需