中文信息检索相关论文
如何从海量的信息中获取有用的信息,如何从迅速爆炸的信息中及时获取最新信息,这是检索技术目前面临的挑战。全文检索是现代信息检索......
该论文中利用中文信息检索标准测试集,对信息检索系统及其算法进行了科学客观的评价,并对中文信息检索的最佳检索单元进行了详细的......
随着网络技术的发展,网络上电子可读文本的日益增加,呈指数膨胀的文本信息资源,使得如何准确有效地获取用户所需要的信息成为人们关注......
随着Internet的迅猛发展,互联网上的信息呈爆炸性增长。研究并掌握信息检索的核心技术具有十分重要的理论意义和广泛的应用价值。由......
随着web的迅速发展,人们从互联网上可以获取资料变得越来越多。与此同时,互联网也以其巨大的信息量给人们带来了前所未有的冲击。在......
随着Internet在全世界的迅猛发展,各种信息资源越来越丰富。信息检索作为互联网的核心技术具有极大的商业价值;信息检索还直接影响到......
伴随着全球信息化进程的迅猛发展,网络上的中文信息资源变得越来越丰富,如何从这些海量数据中挖掘出有价值的中文信息,已逐渐成为......
本文尝试就在教学平台中如何开发与实现智能答疑系统做出解答。文章在详细分析了教学平台中实现答疑系统需求和特点的基础上,对......
在中文信息检索的研究和实践中,由于查询与文件集中词的不匹配现象导致一些相关的文件不能被成功地检索出来,这是影响检索效果的一......
信息检索是一种有效查询及获取相关资料的计算机技术.一般来讲,被处理的对象可以是文本或者音像等任何形式的文件,本文将侧重于对......
中文分词作为中文信息处理最重要的预处理手段被广泛应用,该文从两个方面(检索精度和召回率)深入研究了中文分词精度和分词算法对......
本文介绍了在向量空间模型下,使用Cosine-Measure和OKAPI—Measure两种不同的相似度评测方法,来评测查询与文本之间的相关性。通过针......
搜索引擎Google享有世界最佳搜索引擎之称,其中文信息搜索服务也越来越受到中文用户的欢迎和重视,本文介绍Google在中文信息检索中的......
本文将部分语义信息加入到二元文法中,提出改进的二元文法索引策略。本文应用2-泊松模型的BM25公式在TREC公开数据集上进行了测试......
介绍了LSI技术在中文信息中的应用及其在实际应用中可能会出现的问题,并给出了解决办法。通过将查询和文档在多维空间进行投影,将共......
在中文信息检索的研究和实践中,由于查询中所使用的词可能与文件集中使用的词不匹配而导致一些相关的文件不能被成功地检索出来,这......
在2005年863信息检索评测中,我们主要尝试了采用入链接描述文字。以及我们在去年已使用的词对检索方法。由于只能提交一组自动方法......
本次863中文信息检索评测的目的是检测互联网环境下大规模数据的中文信息检索技术的研究现状和系统有效性,中文与接口技术评测组综......
本文介绍了在向量空间模型下,使用C0sine—Measure和OKAPI—Measure两种不同的相似度评测方法,来评测查询与文本之间的相关性。通过......
对一个检索系统的总体设计思想、主要实现技术作了较为具体的讨论和分析,并陈述了所做的工作.......
分析了传统中文信息检索技术中存在的问题,即计算机将用户提问转换为检索语言时产生的语义失真和损失,导致查全率和查准率较低,达......
索引策略是中文信息检索系统中重要的研究内容之一。对基于字、词和二元文法的索引策略进行研究,分析各自的特点,进行性能对比,在此基......
[摘要] 本文首先从起源,概念,影响范围,中西文信息检索之比较及检索模型几个方面总体介绍了信息检索。继而引入基于向量模型的信息检......
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在......
查询词语和文档中词语的不匹配是影响文本信息检索效果的一个关键因素。查询扩展技术可以在一定程度上解决这种词的不匹配问题,然而......
本文简要介绍了TRS中英文信息发布检索平台,对以C+Builder 3.0 为前端开发工具的 TRS API 编程做了详细说明.根据大庆油田科技情报......
阐述信息检索对汉语分词技术的要求,分析中文信息检索与汉语分词技术结合过程中有待解决的关键问题,并重点针对这些要求及关键问题提......
本文的重点是应用句法分析提高汉语信息检索的性能.本文使用定制的PCFG句法分析算法提取相邻实词的关系.在TREC Mandarin的实验证......
分析了信息检索中的中文分词歧义问题,引入N元文法和平滑算法对切分歧义问题和数据稀疏问题进行处理解决,从而来提高信息检索速度和......
结合循证医学临床研究方法学和CBMdisc数据库的特点,研究开发制定针对临床治疗、诊断、病因、预后四个方面的若干组检索策略,并抽取......
中文信息检索是信息检索领域的一个重要分支。尽管中文信息检索的技术和研究已经取得了相当多的成果,但目前中文信息检索的效果却......
拓尔思(300229):公司脱胎于北京信息科技大学中文信息处理研究中心,自1985起便开始研究中文信息检索,目前公司已拥有大数据领域非结构化......
随着科学技术的高速发展和各种信息资源数量的不断增多,为了提高效率,信息检索己经成为信息科学技术领域最重要的研究内容之一。其......
汉语自动分词问题是中文信息检索的基础问题,也是阻碍其向前发展的"瓶颈"问题.介绍了分词技术的发展状况,分析了分词技术在信息检......
随着各种文本信息资源的迅猛发展,文本信息检索系统已经成为人们获取有用信息不可缺少的工具,而文本信息检索模型作为文本信息检索......
该文运用在西文信息检索中非常成功的向量空间模型来解决中文信息检索的问题,在中文文档的特征项抽取,加权、相似度计算,模型的建......