文档检索中句法信息的有效利用研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:ytzhjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用词项依存关系来改进词袋模型,一直是文本检索中一个热门话题。已有的定义词项依存的方法中,有两类主要的方法:一类是词汇层次的依存关系,利用统计近邻信息来定义词项依存关系,另一类是句法层次的依存关系,由句法结构来定义词项依存关系。虽然已有的研究表明,相对于词袋模型,利用词项依存关系能够显著地提高检索性能,但这两类词项依存关系却缺乏系统的比较:在利用词项依存关系来改进文档和查询的表达上,如何有效地利用句法信息,哪些句法信息对文本检索比较有效,依然是个有待研究的问题。为此,在文档表达上,比较了利用近邻信息和句法
其他文献
知识产权是智力成果的创造人依法所享有的权利和生产经营活动中标记所有人依法所享有的权利的总称,包括著作权和工业产权。这是法律上的一种解释。在经济学中,知识产权是产权
目前,石油企业正在进行重组改制工作。机关人员的重组,部分人员的分流,在职工中引起了极大震动。为此,本文想就企业重组的话题,谈一点个人意见。一、企业重组的必要性企业重
红军时期:严守秘密,服从纪律,牺牲个人,阶级斗争,努力革命,永不叛党。抗日战争时期:我志愿加入中国共产竞,坚决执行党的决议,遵守党的纪律,不怕困难,不怕牺牲,为共产主义事业
近年来研究表明使用主题语言模型增强了信息检索的性能,但是仍然不能解决信息检索存在的一些难点问题,如数据稀疏问题,同义词问题,多义词问题,对文档中不可见项和可见项的平滑问题
该文从文本分析模块入手,利用"维吾尔语语音声学参数库",选择了以开音节和闭音节结尾的969个双音节词的韵律参数,包括元音时长、音高和音强进行了统计分析,归纳了其元音时长、
对于足部的保健和煅炼是藏药浴最为神奇的特色。在藏医理论中,人体四肢有近百条重要的脉道,连接生成脉、串接脉、寿脉、命脉等。通过甘露足浴的热力和药力可以疏通上述脉道,进而
随着我国教育理念的不断转变,高中化学教学也应该适应时代整体的发展潮流,对自身的教育教学方式进行一定的转变,使学生在接受的同时可以做到学以致用。对学生进行教育教学的
<正>一、1998年全球约生产2.42亿只1998年,全世界生产彩色CRT(含个人电脑显示示器用CDT)约2.42亿只,比1997年增长6%.CPT和CDT分别为1.4O亿只、102亿只.其中西欧O.334亿只、北
本文提出了一种结合SVM学习和产生式模型的依存分析方法。该方法用产生式模型的分析错误对SVM分类器进行训练。为进一步提高分析精度,采用扩大寻优范围的动态规划算法对产生式
多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析