中文问题分类和句型分析的研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:cshuangyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速发展的因特网为人们提供了丰富的信息资源。虽然人们可以在因特网上通过搜索引擎找到他们所需要的信息,但是在获得信息的同时,也附带来了大量的无用信息,需要他们进一步地去甄别。与搜索引擎相比,中文问答系统允许用户以自然语言的方式进行提问,返回给用户的是精准性的答案,不需要用户再去甄别答案的准确性,缩短了用户获取信息的时间,可以更好地满足人们的需求。   中文问题理解是中文问答系统的基础,只有在正确分析和理解问题的基础上,才有可能将正确的答案返回给用户。问题理解包括问题预处理、句法分析、问题分类、句型分析和浅层语义分析等处理过程。其中问题分类和句型分析作为问题理解中非常重要的两个处理过程,问题分类的准确与否直接影响到最终答案的准确性;句型分析确定了答案的生成模式,其中的句型成分决定了答案的重要程度。本文主要进行了以下三个方面的研究工作:   (1)针对支持向量机问题分类中存在冗余数据、数据量维数大、处理速度慢等缺点,提出了一种基于粗糙集理论和支持向量机技术相结合的CRV问题分类方法。该方法首先利用粗糙集理论中的属性约简方式预处理样本数据,消除冗余的特征向量,有效地降低样本数据空间的维数,然后将约简后的最小特征量作为支持向量机的输入量,有效地提高了支持向量机收敛速度和分类的精度。   (2)对问题进行分类之后,在同一种类型下,针对同一个问题焦点的提问可以有很多种问法,为了使同类型同焦点的问题可以按相同的方法进行处理,这样既可以减少问题库的存储空间,又加快了回答问题的速度。因此本文对同类型和同焦点不同问法的问题进行分析,将用户提出的问题转为问题标准型QSF进行处理,并相应地给出了问题答案的句型形式,使得问题和答案在形式上相一致。   (3)将上述提出的CRV分类方法和问题标准型QSF应用于我们设计开发的《计算机网络》课程的个性化学习系统中的自动问答系统上,运行结果表明利用CRV分类方法和问题标准型QSF来理解问题,有较快的回答问题的速度和较高的准确率,实现了对问题的准确理解。
其他文献
当下,海量视频数据中包含着丰富的信息,对于这些视频进行分析处理的需求也越来越多。有的视频其视频质量非常低,其中字符大小极小,而且受到噪声的干扰,本文中称为“超低质量
半径-间隔学习方法作为机器学习领域较为热门的研究方向之一,在分类和识别等应用中得到了广泛的关注。半径信息的变化隐含在特征变换过程中,对于分类器的性能优化起着重要的
RFID技术是一种非接触的自动识别技术,操作方便、快捷,阅读器可以在一定范围内任意方向读取一个标签或多个标签,其优势是交易速率快,但由于安全性不高,在实际应用场景中受到
随着通信和无线接入技术的快速发展,能够为移动的主机提供网络的服务成为一种需要。移动IP协议是通信终端在移动中保证通信连接性的协议,通过该协议可以使终端在移动时仍然保
Blog是一种基于RSS技术的信息交互平台,它是一种作者与读者以日志风格进行交互的中介。与传统的网络信息相比,Blog领域链接关系更加丰富,Blog作者间交互更加频繁,Blog为用户在互
在家庭环境中应用多元化的无线传感器产品,已经成为当前无线传感器网络(WSN)技术和智能家居结合发展的一种趋势。而家庭无线传感器网络(HWSN)技术的广泛应用将衍生出大量的家
随着网络和多媒体技术的发展,数字作品的版权保护和真实性认证成为人们的迫切需求。本文研究基于水印的数字图像版权保护和内容认证相关算法及应用,力求面向应用实际需要,在理论
随着Web服务的发展,组合Web服务应用领域越来越广泛。然而,组合Web服务本身可能由来自不同地区不同级别的服务组成,远程原子服务的不确定性以及不稳定的网络环境等因素难以保
和传统的鼠标、键盘等人机交互设备相比,手势是更自然、更便利的交互方式。基于手势的实时人机交互在虚拟现实领域有着重要的理论和应用价值,它可以用来实现三维鼠标以及用于
近几年来,以欺诈、篡改、盗窃电子数据为表现形式的高科技犯罪手段与日俱增,计算机取证技术已经逐渐成为当前的研究热点。但是目前计算机取证技术研究,主要集中在电子数据的