切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
基于特征码的网页去重
基于特征码的网页去重
来源 :微计算机信息 | 被引量 : 0次 | 上传用户:whuagnqn
【摘 要】
:
网页去重处理是提高检索质量的有效逢径。本文给出了一个基于特征码的网页去重算法.介绍了算法的具体实现步骤,采用二叉排序树实现。算法有较高的判断正确率,在信息检索中有较
【作 者】
:
陈基漓
牛秦洲
【机 构】
:
桂林工学院电子与计算机系
【出 处】
:
微计算机信息
【发表日期】
:
2006年03X期
【关键词】
:
网页去重
网页特征码
二叉排序树
Duplicated webpages deletion
feature code of webpages
binary
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页去重处理是提高检索质量的有效逢径。本文给出了一个基于特征码的网页去重算法.介绍了算法的具体实现步骤,采用二叉排序树实现。算法有较高的判断正确率,在信息检索中有较好的应用前景。
其他文献
浅谈基于PCA的网络流量分析
网络流量的特性分析一直是通信网络性能分析的一个极其重要的问题。本文主要采用主成分分析(PCA)的方法对采样到的网络流量数据进行分析,发现这些流量数据呈现低维特性,仿真结果
期刊
PCA
网络流量分析
PCA
Network traffic analysis
基于DSP Builder的ADPCM算法实现
本文对ADPCM编解码原理进行了分析,并针对语音记录系统的特点,对标准ADPCM编解码系统进行了简化。提出了一种适合语音记录系统的16kbps的ADPCM语音编解码方案,并利用DSP Builder
期刊
ADPCM
DSP
BUILDER
语音记录系统
VHDL
ADPCM
DSP Builder
phonautograph system
VHDL
基于INTEL StrataFlash在VxWorks上构建TrueFFS文件系统
本文以Intel28F320J3A StrataFlash为例,介绍了在实时操作系统VxWorks上构建TrueFFS文件系统的过程.为嵌入式系统的开发提供了在flash上存储程序和数据的一种实现方法,基于此方
期刊
实时操作系统
VXWORKS
FLASH
TFFS
文件系统
RTOS
VxWorks
flash
TFFS
file system
嵌入式Linux下可插拔输入驱动机制研究
本文介绍了嵌入式linux下的输入驱动接口,详细分析了输入驱动中如何实现可插拔机制.描述了USB人机接口设备和可插拔输入模块的接口,最后给出了一个我们将uclinux下ep93xx触摸屏
期刊
嵌入式LINUX
输入驱动
人机接口设备
通用串行总线
触摸屏
Embedded Linux
input driver
HID
USB
Touch Screen
与本文相关的学术论文