主题采集相关论文
主要研究了主题信息采集的相关技术,在基于"词袋"模型的主题采集的基础上设计了基于主题扩展的主题采集,给出了信息采集系统的模型......
简单介绍主题信息采集系统;从5个方面对其核心技术进行深入研究,包括种子页面生成、主题表示、相关度计算策略、爬行策略以及结束......
针对主题信息采集系统存在的采集效率低和可扩展性差等问题,研究分布式采集系统架构,设计一种基于局域网的多节点服务器架构主题采集......
社交网络数据采集是开展社交网络分析的基础.针对当前面向主题的社交网络数据采集技术采集数据少、召回率低的问题,本文提出基于内......
针对主题信息采集系统存在的采集效率低和可扩展性差等问题,研究分布式采集系统架构,设计一种基于局域网的多节点服务器架构主题采......
面向互联网的主题采集是情报获取的重要手段,面对爆发式增长的互联网信息资源,设计并实现一套由采集准备、URL分析及提取、模板学......
提出了一种基于DOM树的词共现模型,首先利用文档的结构信息生成DOM树,并依据DOM树的结构特点来统计文档中主题词的共现信息,最后采用......
本文提出了一种基于主题采集的Web文档自动分类算法,该算法对朴素贝叶斯分类模型进行了改进。利用该算法,我们实现了一个基于主题信......
基于主题的Web信息采集是信息检索领域内一个新兴且有实用价值的方向,也是信息处理技术中的一个研究热点。文章分析了主题Web信息采......
目前互联网上存在着种类繁多的旅游资源,旅游管理部门要对以上资源进行监控,同时游客也要检索出自己感兴趣的个性化信息,这需要花......