Web内容挖掘的研究与实现

来源 :西安交通大学 | 被引量 : 0次 | 上传用户:fly383910564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文通过研究数据挖掘以及Web挖掘技术的思想,并结合智能Agent的知识发现模型,提出了基于Agent的分布式Web多媒体内容挖掘体系结构.研究了文档信息表示理论、中文信息处理的方法,利用VSM模型和TFIDF公式,实现了特定分类文档的特征向量的提取,提出了多维文档的数据结构及以此为基础的文本挖掘架构.研究并实现了HTTP,BBS,Newsgroup的离线下载.研究了Web结构的挖掘,提出将Web内容挖掘和Web结构挖掘结合起来的观点并提出Content relation-transfer方法以实现该目标.研究图片编码,特征提取技术,提出图象信息数据模型,总结了在该模型上的图象聚类过程,针对工程图纸实现了完整的图象挖掘过程.
其他文献
该文首先研究和分析了面向对象软件的特点,总结出面向对象技术给软件测试带来的影响和面向对象软件测试和系统软件测试的不同,在此基础上,分析得出面向对象软件测试的内容.最
随着网络教学的逐步普及以及教育站点的增多,网络公式的应用越来越普遍,因此,急需一种高效便捷的网络公式传输系统。目前,网络公式的表达与传输主要只有一种方式,即用图片实现。这
车辆牌照自动识别系统在桥梁、路口自动收费,停车场无人管理、违章车辆自动记录等领域有着广泛的应用.该系统运用图像处理、图像分析和模式识别技术实现车牌号码的自动识别,
该文分析了远程教育教学中应用的交互媒体和交互模式,指出远程教育系统中的两个问题--服务器负载过重和网络拥塞,在研究了解决服务器负载过重的解决办法--基于DNS的负载均衡
该文首先概要介绍了信息隐藏技术和信息加密技术,然后详细分析了数字水印系统的特点、结构和分类、数字水印技术发展现状和应用领域,并从水印设计、水印嵌入、水印检测的角度
JPEG2000是ISO于2000年底制定的新一代静态图像压缩编码标准,准备用于取代目前广泛使用的JPEG标准.JPEG2000与传统JPEG最大的不同,在于它放弃了JPEG所采用的以离散馀弦转换(DC
学位
该文讨论了VPN技术及应用.首先介绍了 VPN的基本概念和应用前景,VPN 的分类和框架体系.阐述了VPN的两种基本类型:VPRNN和VPLS.分析了VPRM的两种实现机制,BGP/MPLS和VR,分析了
IP地址盗用是一个普遍存在的问题,长期以来一直困扰着广大的网络管理人员。尤其是在大型企业网环境下,IP地址盗用更加频繁,同时,解决的难度也较大。IP地址盗用给网络的正常运行带
随着Internet的爆炸性发展以及计算机广泛进入家庭,新的安全问题不断出现.首先,连接到Internet上的家用计算机正快速增长.这些计算机几乎没有任何的安全保护措施,完全暴露在I