基于潜在语义分析的汉语问答系统答案提取

来源 :第二届全国Web信息系统及其应用会议(WISA2005) | 被引量 : 0次 | 上传用户:mysqlfalse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它借助于潜在语义分析理论,对大量问答句子对语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验,实验结果说明该方法具有很好的效果.
其他文献
在阐述数字博物馆中Agent、WebService技术与Ontology模型应用的同时,设计了一个基于Agent的语义网络(SemanticWeb)模型的分布式文物信息检索系统,给出了基于本体理论的信息检索概念及相应的语义推理机制.SemanticWeb是W3C组织制定的下一代Web的目标蓝图,用它提供了一个基于语义的信息共享的平台.
提出了一种通用异构数据源集成系统的原型OBISUA(Ontology-BasedIntegrationSystemUniversalArchitecture),在此基础上给出了两个查询重写算法将用户提交的全局查询转化为对数据源的查询,并利用缓存来存放用户对全局本体的查询结果,对于无法由缓存取得结果的查询,有两种查询处理的方法:一种是将查询直接分发给各个数据源处理;另一种方法是将查询分解,然后分发给
随着信息技术的快速发展,信息无论是在量上还是在表现形式上都越来越丰富,信息交换和检索的数量巨大,并且非常频繁.信息检索中的"查全率"和"查准率"问题的传统的解决方法是使用基于关键字的搜索技术,但是在许多文件中包含有语义信息,而它们并没有包含用户所需要的关键字.这种情况下如果用基于关键字的检索方式就检索不到该文件.为了克服基于关键字的信息检索技术的这一缺点,我们需要使用本体来设计一个基于概念的模型.
在传统的基于内容的图像检索系统中,存在着图像底层视觉特征和高层语义之间的"语义鸿沟",导致检索效果不佳.为缩短"语义鸿沟",该文提出了一种改进的聚类算法,应用于CBIR系统.采用了此聚类算法的检索模型由以下几个部分组成:(1)图像特征抽取(2)聚类分析(3)相关反馈.实验证明:基于改进聚类算法的系统检索性能得到了显著提高.
本文详细介绍了基于MSSharePoint技术建设专题资源信息仓库的总体思路、设计思想、系统架构和具体的实现方法.结合知识管理和内容发现理论,采用系统集成和模块式的软件复用技术,构建了一个安全稳定、易于部署、架构灵活、易于扩展的解决方案和系统平台,为专题资源信息建设提供了一个高效的网络工作环境.
本文通过对近十年知识管理方面文献的统计,总结了近期知识管理的研究重点,反映了知识管理理论框架的大致组成:知识(分类)、方法论和影响因素.综合了各家对知识的理解,重新将知识按照5个不同的维度进行分类;在对17个典型知识管理活动模型进行比较分析后提出了一个新的知识管理活动循环模型,运用类似的方法提出一个具有两个维度的知识管理系统开发方法论;对于文献中各种零散的知识管理影响因素,本文则进行了重新分析与组
自20世纪90年代以来,企业资源计划——ERP软件开发炙手可热,各种信息管理软件层出不穷。但软件的实际水平和开发速度与质量,总是受系统开发模式和技术的制约。随着国际、国内市场环境不断的变化,企业的管理技术与思想有了飞速的发展,人们开始对ERP开发技术提出更新、更高的要求。本文首先介绍了构件技术、实现ERP系统开发的过程.接着介绍了一种构件检索方法.
本文介绍了分布式技术在医院信息系统中的应用,在分析了分布式结构原理及实现需要的关键技术的基础上,讨论了医院信息系统的分布式设计思路.
评测基于客户机/服务器架构的分布式企业信息管理系统(MIS)性能的首要工作就是定制系统负载并根据负载参数的采样数据生成满足一定要求的负载模型.本文将给出上述工作的详细流程和方法,并结合一个具体的分布式企业信息管理系统来阐明负载测试工作的实施过程和重要性.
根据市民政局电子政务工程的管理特点,设计和开发了一套基于三层C/S模式和B/S模式混合软件并用的民间组织管理系统,本文重点对系统运行模式、系统结构、业务流程、设计思想和实现方法进行了阐述.