论文部分内容阅读
自动问答系统的出现极大地满足了人们高效地获取相关信息的需求,但目前的自动问答系统大多是基于常见问题集(FAQ)或者面向开放领域的,对于中医冠心病受限领域而言,必然存在答案专业性差、正确率低、语义理解力差、不灵活等的弊端。如何改进和设计自然语言处理(NLP)方案来适应中医冠心病自动问答系统是关键性的问题。中医冠心病本体节点犹如人脑中的神经元,利用构建中医冠心病本体来取代FAQ的知识存储方式,可在一定程度上减轻弊端。因此,本文着力于设计一种针对中医冠心病自动问答系统有效的NLP方案,并通过实现系统来验证方案的适用性和高效性。本文运用专家鉴定的中医文献资料构建出中医冠心病本体知识网络,为系统生成正确、专业性的答案奠定了基础。本文构建出的中医冠心病关键词词库、常用词词库、问题词词库、问句模板和词向量表,可实现对2962个中医冠心病领域关键词和约700篇中医古代文献的信息匹配和提取,并为本文设计的基于折半查找的逆向最大匹配算法的分词方法提供了基础。本文在研究面向受限领域自动问答系统的NLP关键技术基础上,设计了针对中医冠心病受限领域的自动问答系统的实现方案。本文根据问句特点将系统划分为三个问句处理阶段,对于每个阶段有不同的处理方式,分别是基于问句模板匹配方式、基于模式匹配方式和基于词向量相似度计算方式。本文自顶向下地阐述了系统的设计方案,并构建出了中医冠心病关键词模糊匹配算法和基于神经网络词向量的相似度算法,在保证答案准确性的前提下,大幅提升了系统的灵活性。本文运用Delphi7实现了基于本体的中医冠心病自动问答系统,运用Java语言实现了词向量的生成,用Excel和TXT类型的文件存储中医本体、关键词词库、问题词词库、常见词词典、问句模板等数据,通过对系统的测试,进一步验证了本文设计方案对基于本体的中医冠心病自动问答系统的适用性和智能性。本系统可将中医冠心病文献以更易于接受的方式服务于医务工作者、患者,对中医古文献再开发运用意义重大,也为中医领域自动问答系统的研究工作提供了研究范例。