【摘 要】
:
网页分类可对海量网页进行分门别类,可应用于许多方面。现存的网页自动分类方法较多,其中常用的基于网页内容的方法由于网页内容的不纯,导致其存在较大的性能提升空间。基于
【机 构】
:
广东电子工业研究院,中国科学院计算技术研究所,亿赞普科技有限公司
【基金项目】
:
国家自然科学基金(No.60803085 No.60873245), 广东省中国科学院全面战略合作项目(No.2009A0091100002 No.2010A090100004), 东莞市重大科技专项(No.2009215102001)
论文部分内容阅读
网页分类可对海量网页进行分门别类,可应用于许多方面。现存的网页自动分类方法较多,其中常用的基于网页内容的方法由于网页内容的不纯,导致其存在较大的性能提升空间。基于查询日志,提出了一种新型的网页分类方法NQPC。该方法提出一种低维特征向量抽取方法,从而避免"维度灾难";基于优质的查询日志进行网页分类,查询日志相对网页内容而言,具有内容较纯的优点;提出一种提升分类准确率的过滤方法。实验结果表明,提出的网页分类方法具有优异的性能表现,使其具有良好的应用前景。
其他文献
P2P技术为信息服务扣访问提供了新的机遇和挑战,不仅信息量急速增加,信息的发布变得更简单、多样,而且使信息的深度检索变得更加可行.分析了P2P网络中信息服务的相关问题,给
文章从企业科技项目的立项、科技成果及项目验收3个部分对科技项目管理过程进行具体分析,对科技项目实施过程中涉及的人力、物力、财力及项目组织计划安排做出详细梳理,提出
在21世纪,随着教育事业的不断改革以及人们对体育运动健身观念的不断提高,增加了我国对体育人才的需求。高等院校体育教育专业是培养未来体育教师的摇篮,体操课作为高等院校
中日两国自1972年恢复邦交后,为了适应两国文化教育交流,实现中小学外语教育的多样化,教育部门开始有选择地在全国主要大城市开展中学日语教育。我省武汉外国语学校最早开启
通过对后现代认识论、后现代生态学及生态性世界观的分析和研究,从后现代认识论的角度对信息系统进行了再认识,试图论证信息系统的生态性研究是一种后现代的价值观、世界观、认
研究了以二苯甲酮为光引发剂 ,L DPE两步法气相光接枝丙稀酸反应体系的交联特征 ;考察了光照条件、反应温度及光引发剂含量对交联度的影响 ,发现并讨论了接枝反应对交联的促
针对目前工商管理本科专业人才培养缺乏专业特色、课程教学与企业实际需求存在脱节、学生实践能力弱及创业创新能力不足等问题。基于新时代新商科新需求,广西大学工商管理专
介绍了网格技术的定义、内容、特点及国内外研究情况,分析了网格技术在图书馆资源整合、数字图书馆技术、未来图书馆运行模式方面应用研究的现状及趋势。指出网格技术应用于图
从微观经济学角度对数字图书馆的建设规模、投资进行了分析和探讨。说明从经济学角度去探讨是很有益处的,利用市场机制来实现资源最优配置。从消费的主体(图书馆读者)和消费的客