基于Hyperlink聚类的网页分类研究

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:Guihuaxuetu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究并提出了基于Hyperlink聚类的分类算法,它不需要分析Web文档内容,只根据Web图来聚类.算法性能比传统文本分类方法有很大提高,大大增强了网页分类的能力和效率,适合于海量网页分类.实验表明基于Hyperlink聚类的分类算法,应用于Web文档信息分类,比传统的文本分类方法更加有效.
其他文献
采用气相射流模型对二甲基醚的喷雾特性进行了模拟计算,并将其与柴油喷雾的模拟计算值进行了对比.结果表明,在喷孔直径、环境密度等参数相同的条件下,二甲基醚喷雾的轴心速度
论述了新一代电网继电保护分析计算及管理一体化系统的设计思想,提出了该系统基于统一数据库平台和图形平台的系统设计,论述了统一图形平台中的一对象多图和图形平台移植性等
在钛酸锶钡与质量分数为60%的Mg0混合的基础上,进行了‰()3掺杂的系统研究.随‰03掺入量的增加,~r-MgO材料的晶面间距先变大后变小.掺杂适量的La203可降低BST—Iv/go复合材料高频损
在研究均匀化理论和拓扑优化理论基础上,推导了复合材料的均匀化求解方程,并将均匀化理论应用于拓扑优化中,推导了基于均匀化理论的二维拓扑优化求解算法.
简述了FDM快速成型工艺的原理,提出了一种基于直线扫描的支撑自动生成算法,实现了扫描线段的并、差运算,在此基础上实现了加工路径分区、优化,定义了特定的zIF文件格式,解决
因为不满足常规的库存控制模型所要求的条件 ,常规的库存控制方法不再适用 .针对维修配件的库存控制问题 ,研究三个基本的问题 :哪些维修配件必须有库存 ?库存量应该为多少 ?
推导了用于拓扑优化的准则法,给出了基于均匀化理论的拓扑优化迭代分析流程;编制了基于均匀化理论的二维拓扑优化程序,通过二维数值算例验证了算法的正确性和有效性.
在分析不规范书写的Web网页的DOM树存在的树深度大、结点层次多、结点层次和子树间关系错误等问题的基础上,提出了一种容错的Web网页语义树构造方法,为文本分类与聚类、网络
期刊
在自行设计的小型高温炉上对某厂燃用的原煤和煤泥混料掺入添加剂进行静态燃烧试验,采用化学成分分析和XRD的方法来对燃烧灰渣的组成进行定量和定性的探讨,并对其灰分矿物特