基于PAT-tree的中文搜索引擎结果聚类算法

来源 :情报杂志 | 被引量 : 0次 | 上传用户:linchenxu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为中文搜索引擎返回结果的每一条记录构建一种修改的PAT-tree结构,为整个返回结果集构建修改的整体PAT—tree结构。通过计算PAT—tree中有效节点代表短语的排序权值函数,提取基本聚类。使用与STC框架相似的聚类算法得出最后的聚类。实验表明该算法能很好地完成中文搜索引擎结果的聚类。
其他文献
信息资源的建设和开发、大资源共享观的日益形成,已成为21世纪图书馆发展的主要方向.建设数字化图书馆,实现信息资源共享就成了当务之急.
从语言分析入手,循着由表及里的思路,探寻隐藏在传统知识的名称含义、特征及表现形式背后的本质属性,并从法律保护需要的角度提出:传统知识是指一定地域范围内的某个社群所持
采购成本作为石油企业现金支出的主导因素,在石油企业的总体成本中占有很大比重。随着市场竞争加剧,现代石油企业对采购成本的控制越来越重视,但在具体实践中,由于缺乏科学的
"农家书屋"建设是社会主义新农村建设的一个新课题。近年来,"农家书屋"建设已初见成效,但在管理上仍存在着尚不规范、体制相对滞后等局限,有必要在规范化建设上下大力气,寻求解决
就目前来看,我国的高职教育课程模式占我国教学模式的主要导向的,这就使得在高职教育课程模式下培养出来的人才与市场需求有较大的差距或者方向不一定吻合,影响高职培养人才
从六个方面分析了现代信息服务业,并探讨了信息服务业的发展对图们江流域朝鲜民族地区经济发展的意义,以及改善图们江地区国际经济合作发展的信息服务环境问题.
本文立足于土木工程信息化的基本内涵与显著特征,详细分析了土木工程信息化的战略目标,并结合笔者多年土木工程信息化相关工作经验,提出了深入对土木工程信息化的了解与认识
在对企业集成信息系统(EIIS)功能分析的基础上提出了EIIS的三维功能模型和概略模型,阐述了EIIS的开发方法和开发过程,指出运用面向对象的信息工程方法论开发的EIIS能够实现企
通过对合作数字参考咨询的一个简单模型进行博弈分析,揭示了一个非合作的困境,并提出建议,认为应该从分工、质量控制和补偿上着手来对机制进行改进.
随着高等教育对应用型人才的培养要求,高校越来越关注实践教学。本文针对市场营销专业的几门主干课程,对相关的实践教学方法进行简单探讨和总结,并对几种常用实践教学方法的