网页自动分类系统的设计与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:yiwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅速发展,网络信息不断膨胀.为了提供高效、准确的信息服务,我们需要对网络中纷繁复杂的信息进行合理的组织与分类.该论文以网络文本信息处理为背景,从理论和应用的角度对文本信息的分类方法进行了较为深入的研究.研究的主要内容包括文本信息的描述与特征提取和权重的计算;基于向量空间的文本分类方法和K-NN法的文本分类方法;网页文本的空间结构信息的表示和抽取及其在网页分类系统中的应用.
其他文献
随着电子商务的发展,企业信息处理的数据量越来越大,企业信息门户(EIP)的概念应运而生,它不仅为企业用户提供了统一的应用界面,而且把整个企业所需的数据和应用(包括企业的ERP系
随着电子技术和生产制作工艺的迅速发展,单片机以其高可靠性、高性能价格比,在工业测控系统等领域的应用日益广泛。同时,为了适应现代工业测控系统越来越高的要求,单片机的复杂程
为了克服传统的基于文字检索存在的主观性、低效率等缺点,人们开始强调基于内容的检索技术。考虑到图像信息对于信息获取的重要意义,本文主要研究了基于内容的图像存储(图像数
随着Web2.0的迅速发展,用户越来越多地参与到互联网的信息交互中,形成了以标签为代表的社会化标记等广泛应用。尽管围绕着标签应用进行的研究日益增多,标签应用的性能提升却
重载和轻栽是目前软件开发过程中的两大阵营。重栽类过程强调规范化、量化、固化,即管理手段规范化、质量管理要量化、软件文档生成固定化。因此重载类过程往往要求企业有大量
随着计算机及其相关技术的发展和人们生活水平的不断提高,人们对计算机的要求不再是网上冲浪、办公、娱乐等,而是希望它能用于家庭生活的方方面面,例如:家电控制、室内环境控
作者在深入研究基于J2EE的组件设计的基础上,提出了自适应数据库连接池的概念,扩充了J2EE中JAVA数据库连接池技术,详细给出了自适应数据库连接池调度算法及实现方案,并通过实
本文结合实际课题—陕西柴油机厂销售信息系统及西安航空发动机集团生产准备信息系统的建设,研究了企业WEB系统开发与移植中的若干关键技术及其应用方法。 本文提出了一种
通过对PCNNs工作原理和行为机制的深刻剖析,我们揭示了PCNNs的相位调制和对数变换之间的对应关系,并在此基础上参考了人眼的视觉模型和由传统感知神经网络对这种模型的实现,
该文主要研究了将嵌入式系统接入到Internet网上的方法.在综合考虑了其它的各种相关方法后,采用瘦服务器的方式,这种方式主要思想是智能仪表部分和网络接口部分的分离,设计了