智能问答系统的设计与实现

被引量 : 34次 | 上传用户:mimistart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能问答系统是融合了自然语言处理技术和信息检索技术的人工智能产品。根据目标的不同,智能问答系统被分为开放领域与限定领域两类。本文设计并实现了限定领域的智能问答系统,并重点研究和改进了相关算法。本文所实现的智能问答系统主要包含知识库梳理、问题理解、问题检索三大模块,涉及的技术包括排序学习、词向量、模糊匹配、卷积神经网络、语言模型以及Luence。作者本人的主要工作是改进并实现基于卷积神经网络的混合向量模型和排序学习模型,参与了四川省凉山州政府政务智能问答系统的具体实现。其中混合向量模型、排序学习模型的设计与实现由本人独立完成,并参与了凉山州政府政务智能问答系统的需求分析、详细设计以及编码阶段。基于卷积神经网络的混合向量模型,主要使用词向量技术、卷积神经网络技术。其中,词向量技术源于谷歌2013年提出的word2vec开源工具,卷积神经网络技术的优化目标为间隔最大化。混合向量模型包括问句向量生成模型以及答案向量生成模型,模型生成的问句向量和答案向量并不针对某个特定分类目标,而是不同种类的向量彼此之间的间隔最大化。答案向量生成模型在优化答案向量的同时也优化问题向量,通过彼此优化的方式达成协同最优效果,组成混合向量模型。排序学习模型是一种运用机器学习的方法解决排序问题的模型。典型的排序学习模型分为三种,以单个文档作为训练对象的PointWise模型、以文档之间偏序关系作为训练对象的PairWise模型和以文档列表作为优化对象的ListWise模型。本文采用基于ListWise模型的ListNet模型完成排序学习训练。排序学习模型以混合向量模型的结果作为特征,另外加入关键词特征、模糊匹配特征,通过排序学习得到这三个特征的权值信息,用于优化排序结果。实验表明,本文所述智能问答系统的检索答案比Lucene检索答案的准确率提高了17%,验证了本文所提算法的准确性。目前该算法模型已成功应用于四川省凉山州政府政务智能问答系统中,取得了不错的效果。
其他文献
随着社会发展和经济水平的提高,机动车保有量,尤其是私家车的数量大大增加。汽车数量的增加带了很多随之而来的问题,其中交通拥堵和道路安全问题尤为突出。因此研究人员提出
隐喻是一种普遍的语言现象,在人类的认知中具有重要的作用。英、汉两种语言中都存在着大量以马喻人,且都源于"人是动物"这一母隐喻命题。本文首先介绍black horse,dark horse
公司秘书的职能在于在公司决策过程中,能够给予决策主体在知识理论、技术能力、经验和精力等方面给予补偿,提高决策的科学性和时效性以及协调各类组织、工作、人员之间的关系,促
当前中国汽车工业正处于飞速发展时期,制造工艺和生产能力已经与上世纪六十年代沙发加轮子的时代有了根本的飞跃,但摆在中国汽车工业面前的事实却是我们的造型设计还处于学习和
在我国经济的不断发展下,工程建设数量显著增加。为了保证工程施工质量,需在施工前做好工程地质勘查工作。文章首先对工程地质工程勘查的基本要求进行了分析,然后对工程水文
数字时代的来临,导致传统媒体传播形式和渠道以及传媒市场原有的格局发生新的变化。面对新挑战和市场白热化竞争所带来的新要求,作为传统媒体形式代表之一的文化类文摘报,如
公务员绩效考核已经成为公务员管理的关键所在。改进和完善公务员绩效考核,对于打造高效廉洁的政府,提升公务员队伍的整体素质和水平,不断增强履职尽责的能力,具有十分突出的
房地产行业作为国民经济的支柱产业,与社会经济发展息息相关,一直备受社会关注。近期的房地产市场一直处于较低迷状态,这种状态代表了房地产行业正趋于成熟化、理性化发展。如何
公司、企业成立制度简易便捷趋势的发展,加之越来越激烈的市场经济竞争,公司、企业利用破产免责制度来逃避债务的欺诈行为越来越多。从世界各国的刑事立法来看,市场经济越是成熟
目前,中国的房地产越来越成熟,市场秩序越来越优化,竞争也越来越激烈。由于房地产市场受到国家政策的调控,房地产行业已经来到了冬天,昔日的雄风已成为历史在当前激烈的市场竞争环