WWW上的信息获取方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:mqkxxmvo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文首先对数据挖掘与发展,Web搜索引擎,Web上信息获取与挖掘进行了全面的综述.描述了这些领域所研究的问题和发展动向. 论文对目前网络挖掘进行了全面的研究,并针对网络上特定信息的提取做出了进一步的探索. 描述了万维网挖掘系统的功能设计,总体结构设计.完成了万维网挖掘系统中特定信息搜集系统的设计与实现,包括工程数据库的设计,人机交互界面的设计与实现.对该系统进行了测试,效果良好. 该系统运行在Microsoft Windows2000系统下,利用多线程对特定的信息进行快速而有效的收集,并将相关信息存储在Microsoft SQL Server数据库中,以便在后续的挖掘过程中能够充分利用数据库的结构化特征来进行进一步的挖掘工作.
其他文献
Web服务通过标准的Web协议来提供服务,是一种服务导向架构的技术,用这种技术可以保证应用服务在不同的平台上进行互操作。由于计算复杂度和人们对应用服务需求的提升,Web服务
随着视频压缩技术的日益成熟,数字视频监控产品逐渐成为了市场的主流.人们迫切希望网络技术能够成功地应用于数字视频监控领域,以使人们能够通过网络实现异地监控.正是在这种
该文首先介绍了基于案例推理(CBR),经较了它与传统的基于规则的方法的不同.介绍了CBR与其它方法的相结合以及复杂案例推理.然后文中讲述了作者如何使用CBR的方法建造一个动物
该文对丘克拉斯基(Czochralski-Cz)法生长Nd:YAG晶体的工艺特点进行了评述,并在此基础上进行了Nd:YAG晶体Cz法生长的数值模拟研究.在研究过程中,采用了有限差分法,给出了动量守
数据挖掘是一项较新的数据库技术,它基于由日常积累的大量数据所构成的数据库,从中发现潜在的、有价值的信息—称为知识,用于支持决策。数据挖掘是一项数据库应用技术,存在广泛的
计算机电话集成CTI技术自从产生以来,它已经被广泛应用于电信领域.当前很多的CTI应用需求都很相似,但各个应用都单独进行开发.重复工作量大,产品开发期长.该文针对这些问题,
该文讨论了半无限非线形规划的定义,并对半无限非线性规划的求解进行了探讨,由于半无限非线型规划的可行域非常大,因而提出了用"沿梯度方向下降的种群整体变异法遗传算法"来
本文在面向分布式GIS的空间数据库模型的基础上,研究探讨了如何实现空间数据库引擎的高级应用接口。该应用接口对空间数据库中的空间数据进行组织和管理,为GIS应用系统开发者提
该文的研究工作主要分两个部分.在第一个部分中,该文提出了应用层感知的自适应的多媒体流传输协议.这个协议是一个通用的多媒体流传输层协议. 在第二个部分中,该文提出了应用
高等学校网上招录管理信息系统[Management Information System of University Enrolment on the Network](UENMIS)是为了实现教育部关于高校招录上网的相关要求而立项开发的