主题蜘蛛相关论文
互联网的快速发展导致互联网信息资源的爆炸似的增长,人们在享受互联网为我们的学习工作提供便利的同时,也为我们从庞大的互联网络......
介绍了基于文档矢量模型进行文档相关度计算的面向职业教育的主题蜘蛛,并结合页面链接上下文信息对URL进行预过滤,可采用多机并行......
首先研究了面向主题的网络蜘蛛的关键技术:抓取目标描述、网页分析算法和网页搜索策略等,在此基础上,设计并实现了一个面向主题的网......
针对多媒体资源在网上的分布特点,采用链接类型过滤、网页内容过滤、链接内容过滤三层过滤和临时页面存储、目标页面存储、中间链接......
面向语义是提高检索效率的有效途径。基于本体技术,提出了一个面向特定领域的信息检索模型,重点研究了结合本体的信息收集、信息抽取......
在研究网站元数据的基础上,介绍一个以基础教育网站为检索对象的搜索引擎系统。结合基础教育网站的特点,分析该系统的关键技术,如主题......
通过对国内外20种期刊网站结构和页面内容的分析,总结出期刊网站的Surface、聚类、树形、干扰4种特性,把期刊网站页面分为卷期索引、......
随着INERNET的迅猛发展,网络资源呈几何式增长,人们越来越不满足于大型搜索引擎所提供的服务,开始关注各种各样的主题式搜索引擎。主......
随着Internet和WWW的迅速发展,Internet上的资源日趋丰富,人们也越来越多地依赖网络进行学习和研究。为了帮助人们在浩如烟海的网......
随着Internet的迅速发展,专业化搜索引擎因其可以准确且快速检索特定用户需要的专题信息而越来越受到广大用户的欢迎。然而,专业化......