基于邻接矩阵的全文索引模型

来源 :软件学报 | 被引量 : 0次 | 上传用户:benxiaohai741
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不同的方式实现文本串邻接矩阵,导出了两种基于邻接矩阵的新型全文索引模型,即基于邻接矩阵的倒排文件和基于邻接矩阵的PAT数组.给出了基于新模型的文本查询算法;分析了新模型的存储空间和查询时间的开销,并分别与两种传统索引模型进行了比较.对实际文本库进行了测试以证实新模型的效能.新模型能够以相对于原文较小的空间代价获得较大幅度的查询效率的提高,因此适合于在大规模文本检索系统中应用.
其他文献
提出了一种基于Internet、面向光固化快速成型和STL文件的远程在线报价系统,论述了该系统基于模型加工时间的报价原理,对该系统的算法和步骤进行了较详细的阐述.分析和比较了
利用解析信号小波变换方法,将小波变换的时频局部性与信号的解析形式相结合,提取暂态信号的奇异点及各尺度分量的幅值包络、相位、瞬时频率等特征信息.通过理论推导和仿真分
目的 探讨双腔起搏器不同房室延迟(AV间期)起搏对单纯舒张功能不良患者左心房功能的影响.方法 选择植入双腔起搏器的患者76例,分为单纯舒张功能不良组(38例)和心功能正常组(3
乡土材料具有当地性、趣味性等特点。多媒体教学利用好乡土材料,对乡土资源的深加工,有利于增强政治课堂教学的生动性、实效性,更有利于提高课堂的效率。 Native materials
目的 探讨强负荷训练对新兵心肌的影响和可能的机制.方法 随机抽取2012年1月某部入伍1个月健康男性新兵200名,随机分为A组(5 km越野跑)和B组(仅参加日常的队列和一般强度训练
目的:对六味祛风活络膏治疗肩关节周围炎(气滞血瘀证)的安全性及临床疗效作初步评价,为Ⅲ期临床试验提供依据。方法:采用多中心、随机、双盲、安慰剂平行对照临床试验方法,肩关节
建立了在单层有机发光二极管中电场强度不太大 (E≤ 10 4 V cm)的情况下 ,载流子注入、传输和复合的理论模型 .通过求解非线性Painleve方程得出了电场强度随坐标变化的解析函
本文讨论了ULSI的发展对低介电常数(low-k)介质的需求,介绍了几种有实用价值的low-k介质的研究和发展现况,最后评述了low-k介质在ULSI中应用的前景.
提出了一种改进的预先判断视频编码中全零系数的判别准则 ,用于减少低比特率视频编码过程中的冗余计算及运动估计算法的计算复杂性 .实验结果表明 ,对典型的可视电话视频序列
提出了一种新的照明线数据通信方法 ,载波信号通过锁相环把模拟信号转换成数字信号 ,然后通过匹配检测的方法还原出原代码 ,用单片机实现了匹配检测的快速算法 A new lighti