面向养老保险领域的问答系统关键技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ggx8829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
养老保险与社会民生息息相关,广大参保群众在参保过程中常常会遇到各式各样的问题。研究问答系统关键技术,并将其应用到养老保险领域中,用自然语言快速准确地回答用户的问题,具有深远的研究意义和现实意义。本文针对面向养老保险领域的问答技术进行了一些探讨,主要完成了以下几方面的工作:首先,对从问答服务类网站汇集的14万个养老保险主题相关的真实问句进行详细的特点分析,按领域主题制定类别体系。在问句分析阶段结合养老保险领域词库对查询问句进行分词、语义标注、关键词提取、命名实体识别、句法依存关系分析。其次,提出了适用于养老保险领域的KNN主动学习的问句分类算法。从汇集的养老保险领域问答对中抽取一小部分进行人工标注,使用启发式的方法从待标注样本集中选择对分类模型更有益的数据进行标注,扩充已标注样本集,缩减待标注样本集,在此基础上迭代学习,训练得到的新模型分类精度更高。解决标注样本集较小情况下问句分类器准确率低下的问题。然后,提出了新的问句检索模型MFISC。该模型对词汇特征相似度、问句词汇语义相似度、句法结构相似度进行加权运算,求得的值作为查询问句和历史问句的相似度,提高检索精度,最终将相似度最高的历史问句答案作为查询问句的答案返回。最后,完成了以上两种算法的实验,验证基于KNN主动学习的问句分类算法及MFISC检索模型的有效性,对构建养老保险领域问答系统具有实际的应用价值。
其他文献
弥散张量成像技术是核磁共振成像的模型之一,通过测量生物组织内水分子的弥散情况来进行成像。弥散张量成像技术对研究大脑的认知功能和神经结构的正常工作重要的意义。在大脑
人工视觉假体是目前解决视网膜病变所导致失明的最有效办法。国内外研究者在有限的植入电极所形成的低分辨率视觉下,不断努力和尝试,企图找到一些方法来帮助假体植入者,从最初的
随着网络的普及,人们每天都要对Web上海量的数据进行处理,而Web上的数据大多以文本形式存在。如何对这些文本进行分类,首先是通过训练集获取的类别特征构建文本分类器,将待分类的
随着移动互联网的兴起,移动平台Widget应用开发已经成为炙手可热的话题。但由于当前主流的移动开发平台之间互不兼容,造成移动Widget应用开发各种资源的浪费。本文以课题项目为
智能视频监控系统是利用计算机视觉技术对观测到的视频信息进行处理、分析和理解,从而实现对运动目标的监测。随着计算机和图像处理技术的不断发展,智能视频监控系统的研究和
现代软件规模越来越大、复杂程度越来越高,通常都是由许多开发者合作开发完成。由于软件开发工作的特殊性,如何对软件开发者进行准确的评价一直是个难题。目前对各开发者的评价
数据流是一种以高速连续形式到来的有序项集,它不同于传统的数据库中的数据。数据流具有连续、实时、无限等特点,并且是快速到来的数据。由于流数据明显区别于静态数据,现有的对
秘密共享改变了密钥管理的方式,能够分散密钥管理权限,提高了系统的安全性、可靠性以及实用性,对于保障信息的存储和传输安全具有重要的意义,成为网络安全和密码学领域中重要的
问题分类是自动问答系统中对自然语言问题进行问题理解的关键步骤。寻找与问题类别密切相关的特征,对提高问答系统整体的处理性能和效率非常重要。中心词是问题中最能表达“问
随着信息技术的不断发展,移动互联网和社交网络广泛兴起,以数字化为基础的多媒体技术逐渐在人类社会的各个领域得到越来越广泛的应用。图像/视频等视觉信号是数字多媒体内容