基于特征码的网页去重

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:whuagnqn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页去重处理是提高检索质量的有效逢径。本文给出了一个基于特征码的网页去重算法.介绍了算法的具体实现步骤,采用二叉排序树实现。算法有较高的判断正确率,在信息检索中有较好的应用前景。
其他文献
网络流量的特性分析一直是通信网络性能分析的一个极其重要的问题。本文主要采用主成分分析(PCA)的方法对采样到的网络流量数据进行分析,发现这些流量数据呈现低维特性,仿真结果
本文对ADPCM编解码原理进行了分析,并针对语音记录系统的特点,对标准ADPCM编解码系统进行了简化。提出了一种适合语音记录系统的16kbps的ADPCM语音编解码方案,并利用DSP Builder
本文以Intel28F320J3A StrataFlash为例,介绍了在实时操作系统VxWorks上构建TrueFFS文件系统的过程.为嵌入式系统的开发提供了在flash上存储程序和数据的一种实现方法,基于此方
本文介绍了嵌入式linux下的输入驱动接口,详细分析了输入驱动中如何实现可插拔机制.描述了USB人机接口设备和可插拔输入模块的接口,最后给出了一个我们将uclinux下ep93xx触摸屏