高性能网页索引器JU_Indexer的实现

来源 :吉林大学学报:理学版 | 被引量 : 0次 | 上传用户:mzhou2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能网页索引器JU—Indexer用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询.首先给出了JU—Indexer的系统框架,然后描述了索引数据在JU—Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法.实验结果表明,JU—Indexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间.
其他文献
研究一类具有生物控制和比率型功能反应的食物链系统。利用重合度理论中的延拓定理,证明了该系统周期解的存在性,得到一组保证该系统存在正周期解的充分条件。
采用Cu对共蒸发法制备的Cd1-xZnxTe薄膜进行p型掺杂。用X射线荧光、X射线衍射、扫描电镜、紫外-可见分光光度计、热探针、四探针和台阶仪研究了不同Cu掺杂浓度下Cd1-xZnxTe薄
瘦长红珊瑚是台湾贵珊瑚中最主要的品种,其颜色分布独具特色。以瘦长红珊瑚为研究对象,采用电子探针、X射线粉晶衍射、红外光谱和拉曼光谱对其进行测试分析。结果显示样品的
研究一类带有真空的不可压Navier-Stokes方程,在一定条件下得到其古典解的存在性和惟一性.
提出了一种新的基于三维光谱角统计的光谱图像信息提取方法。通过对影像上横向、竖向和对角方向相邻像元间采用光谱角计算相似度,构成一个三维的信息统计模型。该模型反映了相邻像元间所代表物质的相似度,通过在统计模型中设置不同的阈值和提取不同轴向的切片,可以从影像中提取代表同种物质的均匀区域和边缘信息,用于监督分类中训练样本的采集。该统计方法与直方图、散点图等传统统计工具相比,鲁棒性和可靠性更高,提取的信息更
在可见/近红外光谱分析中,提取光谱数据中的有用信息是建立稳健准确模型的前提。ISOMAP是一种有效的提取数据本真维的降维方法,但对噪声和邻域参数都比较敏感。提出了一种改
为了发展一种新型测温方法的热敏磷光涂层,对Mg4FGeO6:Mn的双峰发光光谱的热敏特性进行了研究。建立了具有加热平台的光谱测量系统,测量了Mg4FGeO6:Mn在室温到800K温度下的发光
偏振拉曼光谱是拉曼光谱中的一种,所有的激发光源和收集的散射光都有确定的偏振方向,不同方向的偏振光检测到样品的特点不同。因此,偏振拉曼光谱在表征样品时,一定要注意偏振
讨论一类在相变中产生的高阶扩散方程解的性质, 得到了关于解的渐近性和解在有限时间的Blow-up现象.
母料色调公司因为拥有世界首次出现的着色技术,已获得英国专利,据称,该方法可以容易地使用作热塑性塑料用途的氯乙烯着色。该专利覆盖了母料的配方,尤其是载体配方及制造技术。这