一种启发式网络信息采集系统设计与实现

来源 :北京石油化工学院学报 | 被引量 : 0次 | 上传用户:liongliong542
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决目前网络信息采集中信息主题单一与垃圾信息过多的问题,讨论了一种半人工监督的启发式采集系统。用户向系统提交同一个主题的一组关键词后,系统自动合并多个搜索引擎返回的结果,从而构成一个有序的文档集合。对这个集合利用后缀树算法进行聚类,人工对聚类的结果进行有效与垃圾状态标注并生成训练集构造分类器。当用户提交该主题更多的关键词时,系统可以从各成员搜索返回的结果中自动识别并采集有效数据而过滤垃圾信息。实验结果显示,系统对定主题数据的平均有效信息识别率达到92%以上。
其他文献
自2000年国家教育部提出大力发展高等职业教育以来,高职教育在全国各地得到了蓬勃发展,尤其是在广东,各种类型的职业学院如雨后春笋。本文思考和探讨了如何提高高职计算机网
以牡丹江医学院英语网络教学平台的建设为例,介绍了网络教学平台在医学英语教学中的具体做法:建立网络教学平台、培训师资、将网络平台与课堂教学相结合的具体做法,以及取得的主
在信息技术课中,完成作业是课堂教学活动的重要环节之一,其中上机作业是教师对学生进行评价,检验学生操作能力的重要依据。在机房教学中必然会碰到学生作业文件的存取、发放和评
通过论述高校图书馆应如何为读者提高信息与服务质量,提出了图书馆信息与服务的创新思路。
分析了我国大学包装教育的现状,指出包装教育的研究方向与对人才培养的要求,在此基础上,阐述了与可持续发展中国包装教育相适应的人才培养思路。
目前,随着我国经济的迅猛发展,中等职业学校发展迅速,面貌日新月异,但有许多中专存在着重专业技术教育、轻人文素质教育的现象。本文从实际出发,明确了人文素质教育在中专职
本文分析了国内几所著名艺术院校绘画专业建设,探索设计新的针对独立院校绘画专业的教学改革方案。
研究了一种基于PIC的导轨式全位置管道焊接机器人。该机器人由机械结构和控制系统两部分组成。机械结构实现了小型化、模块化。控制系统采用PIC16F877A微处理器,在良好的人机
在支农工作中,要改变就农业论农业的观念,从统筹城乡发展,促进产业调整升级的层次搞好支农工作。一方面,要从宏观上着眼于不断改进农村金融服务,改善信贷支持方式,使之更加贴