【摘 要】
:
随着互联网的飞速发展,网络信息呈现大爆炸的趋势,获取这些海量信息的搜索引擎应运而生。面对搜索引擎获取的海量信息,研究如何利用有效的技术来存储和检索这些信息具有重要的意
论文部分内容阅读
随着互联网的飞速发展,网络信息呈现大爆炸的趋势,获取这些海量信息的搜索引擎应运而生。面对搜索引擎获取的海量信息,研究如何利用有效的技术来存储和检索这些信息具有重要的意义。目前搜索引擎中常见的方法是利用数据库或索引来存储这些信息并提供接口来检索。本文实现了一种压缩技术和索引相结合的技术方法来解决搜索引擎的网络信息存储和检索问题。本文首先介绍了搜索引擎相关技术,并详细介绍了本文系统的方案所运用的Zip和GZip压缩算法原理,为最终系统的实现奠定了理论基础。然后再针对搜索引擎的网络信息特点进行重点分析。这种信息具有信息量大,时效性强,多媒体化信息,超链接方式等鲜明特点。设计了针对文本信息和非文本信息分别采用Zip算法和GZip算法的方案,进而设计了基于搜索引擎网络信息的压缩系统的方案。接着实现了基于搜索引擎网络信息的压缩系统。系统分为三部分,首先采集网络信息,然后通过压缩算法处理并存储这些数据,最后检索时将数据解压还原为原始信息。最后通过实验测试,从准确性、压缩率、压缩速度三个指标对本文设计的基于搜索引擎信息压缩方案的效能进行评估。实验数据证明了该压缩系统方案的压缩算法具有很高的压缩率和压缩速度且具有实用性,从而有效地解决了搜索引擎的数据存储和检索问题。
其他文献
选取赣中西地区23个ML≥2.0地震的单台波形数据,基于遗传算法,分别采用ω-3和ω-2震源谱模型对每个地震每个水平向的振幅谱进行搜索,得到2组低频水平Ω0和拐角频率fc。目测发现大多数地震震源谱符合ω-3模型,除1个地震的fc接近6 Hz外,其余22个地震的fc均小于3.51 Hz,明显偏低。这23个地震除fc接近6 Hz的这个地震没有出现短周期面波外,其余22个地震短周期面波均比较发育。认为可
利用小波分析独特的时—频分析特性,对轮台5.1级地震前近场多台地倾斜连续观测资料进行了多尺度分解,分析结果发现在地震前震中附近的地倾斜台站几乎都接收到了相同频段的异常信号,周期为几天到十几天,异常信号出现在各个台站的时间也大致相同,主要集中在震前3~4个月;震前异常具有从外围向震中发展且幅度明显增强的时空演化特征。分析认为:这些异常可能与1999年轮台5.1级地震的孕育过程有关。
本文从实验建设与教学环节相结合及自制实验装置,提高经济效益的角度论述了实验建设中应介导的几种可行性措施。
伴随我国城市化进程日益加快,违法建筑问题也日益突出。针对城市违法建筑,地方政府如何采取行政手段进行拆除和拆后管理,是城市发展过程中的重点难点问题,其中,城管行政执法
采用中温批式发酵方式,研究人粪分别与稻秸、尾菜、牛粪按1∶1、2∶1、3∶1的干物质质量比混合发酵的产沼气效果和无害化处理效果。结果表明,纯人粪发酵40 d的产气率仅140.64
震动图是描绘地震产生的地面运动和可能破坏情况的有效工具,主要包括峰值地面速度(PGV)等值线图、峰值地面加速度(PGA)等值线图和仪器烈度分布图等。基于华南数字地震台网记录到
肉羊养殖在我国乃至世界都具有良好的发展前景,改善羊肉品质、提高饲养效益是目前养殖行业与个人需要考虑的基本问题。然而,养殖技术与管理的缺乏使得羊肉质量不高,经济效益也受
随着水利投资建设规模的不断扩大,其投资效率受到密切关注。以山西省11市水利建设评价为例,以水利从业人员、水利建设总投资为投入指标,以地区生产总值、年供水量、粮食产量
养牛户通常比较害怕牛染上口蹄疫,一旦患病,不仅危害养牛户的经济收入,还会影响牛肉的质量,因此必须加大对牛口蹄疫的重视力度,加大预防力度,促进我国牛养殖业更好的发展。
目的:基于中医传承辅助平台(TCMISS),分析中国期刊全文数据库(CNKI)中通过中医药治疗慢性乙型肝炎(CHB)的组方用药规律,挖掘现代中医药治疗CHB的应用特点。方法:收集CNKI中采