论文部分内容阅读
基于多特征和组合分类器的网页分类
【摘 要】
:
网络上有着丰富的信息资源,并且随着时间的推移,网上的信息量爆炸式地增长。网页的分类有助于网页信息检索和管理,如开发和维护网页目录、改进搜索引擎质量、过滤网页内容等。网页是一种半结构化的数据,不同网页的内容和结构不太一样,且网页上有广告、版权声明等信息,这给网页的分类带来了挑战。本文研究网页分类方法,以提高网页分类的性能。首先,提出一种融合文本和结构特征的网页分类方法。采用树状分布的HTML标签表示
【出 处】
:
浙江大学
【发表日期】
:
2020年01期
其他文献
2017年7月文化部印发《文化部“十三五”时期公共数字文化建设规划》,要求加强绩效考核评价,建立以效能为导向的公共数字文化服务绩效考核机制,以群众文化需求为导向,研究制定公共数字文化服务群众满意度指标,建立和完善“第三方”评价机制,加大群众满意度测评方式的应用。随着全球信息社会飞速发展,公共数字文化服务在公共文化服务体系中占据越来越重要的位置,因此对公共数字文化服务绩效评价理论与实践开展研究具有重
学位