基于自然语言理解的智能检索接口技术的研究及其应用

来源 :河北科技大学 | 被引量 : 1次 | 上传用户:xiomantou_3737
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息量的爆炸式增长,当今的时代已经成为了信息的时代,信息检索技术也在逐步趋向成熟,信息检索工具搜索引擎也层出不穷。但是用搜索引擎检索信息并不总是让用户满意,一方面由于任何一个搜索引擎都不可能覆盖互联网上的所有网页,这样就会致使用户检索不到所需要的信息;另一方面由于搜索引擎自身的因素,没能正确准确的理解用户的语意而导致的不满足用户的检索需求;另外,由于搜索引擎用户逐年增加,人群遍及各行各业,年龄从老到幼,他们使用搜索引擎的方法不当引起没能检索到有用信息。所以近年来研究搜索引擎技术的学者越来越多,最终的目的是使搜索引擎使用起来能够更加的方便。作为河北省教育厅2009年度科学研究计划,本课题研究的是基于自然语言的智能检索接口技术的研究以及在高等艺术教育网中的应用,在课题中主要针对自然语言的处理以及利用语音进行输入进行了研究,重点做了以下工作:1)数据采集,主要在网络上采集艺术类网页,并对网页内容进行分析提取,再将网页标题、正文等有用信息存入数据库。在网页采集过程中,使用了在网页中的去噪方法,将网页信息的标题和内容等有用信息提取出来,为后续的检索打下基础。2)利用语音进行检索输入,语音输入能让用户在检索过程中更加的方便。将语音识别技术引入到搜索引擎,不仅让用户在使用搜索引擎时更加的灵活,同时还能够使一部分特殊人群(如手部伤残者)使用搜索引擎检索信息。在研究过程中,采用了不同的方法进行尝试,语音识别功能实现后通过不断训练使识别准确率达到了一个用户可以接受的效果,并和其他的语音引擎进行了比较评判。3)自然语言处理,课题主要从疑问句的检索和重定向的研究两个方面进行设计,使得系统的搜索引擎有较高的使用价值,并通过实验证明了系统引擎的优劣。
其他文献
Web技术的快速发展使微博成为人们进行沟通与交流的一种新型社交网络平台。在该平台上,用户可以自由地发表对某些话题的观点与看法。微博内容简单、发布容易的特点使其每天产
网络技术,数据库及数据仓库技术的飞速发展使得数据大量堆积,为从大量数据中发现隐含的知识信息,数据挖掘技术得以出现。随着数据量的急速增长及人们对隐含知识的迫切需求,数
为解决基于身份密码体制的密钥托管问题,2003年,Al-Riyami和Paterson提出了无证书公钥密码体制。无证书公钥密码系统和基于身份的密码系统一样,无需CA颁发的数字证书来认证公
形式概念分析是一种概念化知识处理的有效工具,现在已广泛应用于知识发现、软件工程、信息检索、数据库管理、Web挖掘等很多方面。随着网络的发展和数据库规模的增大,数据库
六脉渠是古广州城在水环境治理方面的一个成果,它主要有六条排污、防洪、抵御海水侵袭、通航的大水渠组成,是我国古代广州城的主要水系网络。现在,广州城的水系已经不用六脉
互联网时代商业模式的重要作用已经得到社会各界的高度重视,企业之间的竞争已由产品、渠道、价格等竞争转变成商业模式之间的竞争。电子商务和移动电子商务作为互联网时代两
在获取图像的过程中,存在很多的因素会导致获取到的图像质量下降,如采集设备自身的光学成像系统的成像质量差,大气湍流、扰动,目标对象的相对运功,噪声造成的图像污染等。图
近年来,web服务作为一组构建面向服务体系(SOA:Service Oriented Architecture)解决方案的标准,已经成为互联网上应用程序之间进行交互的主流技术。但是,随着互联网应用的不
量子信息学是建立在量子力学与经典信息学基础上的,以量子状态载荷信息,实现信息存储,并遵从量子力学规则对信息实施处理与传输。量子信息学与遗传算法的结合,能有效地避免传
句法分析是自然语言处理的一个基本问题,其主要任务是判断输入的单词序列能不能构成合乎语法的句子,构造出合乎语法的句子的句法结构,也就是应用语法规则或其它知识,依据该输