一种层次化的检索结果聚类方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:gj12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高.
其他文献
HPDPM系统是基于无共享群集结构的支持并行数据处理的中间件.提出了中间件系统的体系结构和主要功能模块,详细论述了利用中间件系统实现并行数据处理的方法.阐述了实现数据放
本文综述了σ受体的一些基本特点以及它与抗精神病药物所引起的运动障碍之间关系,提出在抗精神病药物诱发运动障碍的机理方面,σ受体的作用值得重视。
本文综述新型抗抑郁药对细胞色素P450酶系统的抑制作用及有关的药物间相互作用。
This study investigates whether L2 learners of English rely on their L1 (in this case Chinese) when attempting to comprehend an idiom in English and whether the
12月21日至22日,2011年中国成人教育协会年会暨三十华诞纪念会在北京国际会议中心举行。2011年是中国成人教育协会成立三十年周年,年会的主题确定为“回顾总结,展望未来,再铸辉煌
在《会展旅游管理》课程改革中,通过对职业岗位工作分析来确定课程的知识和能力目标,依据实际工作过程和工作内容设计课程教学内容和顺序,选择一个真实职业活动中的工作项目为实
计算语言学科虽然诞生的时间不长,但是近年来发展势头迅猛,已经渗入了如搜索引擎、数字图书馆等许多应用领域。以统计理论为基础建立起来的n-gram模型已经成为近年自然语言处理
调查及教学实践表明,独立学院经管类课程开设双语教学有其必要性和可行性。对于影响双语教学质量和效果的最主要因素,选择最多的依次为教学方法与手段、教学环境和条件、师资。
农民职业培训是提高农民技术生产能力、促进农业科技推广和增加就业机会的有效手段之一。对河南省参加农民职业培训效果的调查结果显示,农户种植规模较小、文化素质不高、职业
随着土地整理行业的不断发展和规范,土地整理专业监理公司面临着严峻的竞争局面。文章介绍了企业核心能力的概念及其特征,分析土地整理专业监理公司构建项目全寿命周期监理咨询