基于提取网站层次结构的网页分类方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:mxh1289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容的分类和基于网页间超链接结构的分类。但是这些分类都只利用了网页的信息,没有考虑到网页所在网站提供的信息。文中提出了一种全新的对网站内部拓扑结构进行简约的算法,提取网站隐含的层次结构,生成层次结构树,从而达到对网站内部网页实现多层次分类的目的,并且已经成功应用到电子商务智能搜索和挖掘系统中。
其他文献
通过试验研究了起动结束标志转速、起动油量、环境温度等因素对电控柴油机起动性能的影响。试验结果表明:起动油量脉谱油量一定,稳定运转阶段的HC排放的峰值随着起动结束标志
为了应对电动汽车充电和风光出力的不确定性以及分散化电力交易的风险,提出基于联盟区块链技术的电动汽车充电交易平台和考虑风光出力的电动汽车有序充电策略,并且用相对鲁棒
<正>药源性高血压也称医源性高血压,是继发性高血压病因之一,由药物不良反应以及联合用药的相互作用或用药方法不当引起。药源性高血压的升压机制比较复杂,有些还不清楚,但大
<正>鼻衄案石顽治朱圣卿,鼻衄如崩,三日不止,较之向来所发之势最剧。服犀角、地黄、芩、连、知、柏、石膏、山栀之属转盛。第四日邀余诊之,
期刊
<正>2007年5月,复旦大学附属华山医院迎来了她的100年盛大庆典,100年的华山内涵,100年的华山传统,100年的华山文化,浓缩在"创业、敬业、改革、奉献"的华山院训里,浓缩在"人道
<正>2012年12月18日,位于嘉定新城的上海交通大学医学院附属瑞金医院北院和位于宝山区顾村公园北侧的复旦大学附属华山医院北院开院试运营。两院建筑面积均为7.2万平方米,核
为建立快速检测猪流行性腹泻病毒(PEDV)和猪博卡病毒(PBoV)3/4/5型的双重PCR方法,本研究根据GenBank中登录的PEDV ORF1基因序列和PBoV不同基因型VP1序列,设计2对特异性引物,
<正>近年来,用药安全越来越受到重视,尤其是儿童用药。据2010年人口普查数据显示,我国0~14岁儿童人口数量达到2.2亿人,占全国总人口16.60%[1],每年患病儿童数约占总患病人数的
目前,我国电子商务物流"最后一公里"配送问题已经成为电子商务发展的瓶颈。阿里巴巴为改善现状,提出"菜鸟驿站"的项目,从而有效的解决了这个瓶颈问题。菜鸟驿站的出现,是对现
针对新高考背景下阅读教学有所削弱的情况,在开阔的视域中整合相关的课内外文本资源,进行类文合观,可以开掘每一个文本所拥有的内容和手法资源,为学生的高考奠基,进而为学生