基于聚类的信息检索可视化系统的设计与实现

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:xjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在查阅大量与信息可视化相关的文献的基础上提出了基于聚类的信息检索可视化系统的设计方案,并结合Struts的MVC框架、后缀树聚类(Suffix Tree Cluster)算法、开放源代码的Prefuse项目实现了一个基于聚类的信息检索可视化原型系统。论文主体包括以下部分: 第一章指明了本文研究的背景及意义。介绍了信息可视化的概念,指出了研究基于信息可视化技术的检索系统的实际意义。 第二章介绍了信息可视化在国内外的研究现状,并针对已有的信息检索可视化系统进行分析及研究。 第三章简单地介绍了聚类算法及其分类,并着重介绍了两种主流的文本聚类算法:k-Means算法和后缀树聚类算法。通过对比,选择后缀树聚类算法作为本系统的聚类算法。 第四章对当前流行的开源可视化项目进行了调研,通过比较从中选择开源项目Prefuse作为本系统的可视化模块。 第五章原型系统设计与实现,及部分实现细节。 第六章指出了本文的实际意义、系统不足和下一步的工作。 在研究已有的信息可视化技术的基础上提出了针对期刊搜索引擎进行结果可视化处理的设计与实现方案,并利用后缀树算法对检索结果进行主题聚类,生成检索结果的聚类导航,辅助用户更快速地找到自己需要的文献。本文所提出和实现的基于聚类的信息检索可视化系统设计方案可以在不改变已有的期刊搜索引擎的基础上嵌入使用本系统,使检索结果更加生动,为用户进行信息导航,提高用户的检索效率。
其他文献
中国图书馆学会专业图书馆分会拟定于2009年9月中上旬举办2009年学术年会,年会主题:专业图书情报机构的知识服务创新与可持续发展。年会将汇聚专业图书情报工作者及其它类型
网站自动评价是一个新兴的研究领域,网站的结构复杂,规模庞大,变化频繁,使传统网站评价方法难以胜任,迫切需要一种新的评价方法来解决评价效率、评价准确性等问题。本文的研究目的
现代信息技术飞速发展,为古籍引书计算机识别提供了可能性.本研究的目的是研究古籍引书的引用模式,进而探讨模式识别方法在引书识别中的应用.具体方法是以明、清及民国时期广
为顺应图书馆学情报学及相关学科近年来不断发展、融合、创新的需求及国际上学术出版频次逐渐加快的趋势,《图书情报工作》于2009年全新改版,推出国内图书馆学情报学领域第一
期刊
台北“年味”只有在台北老城区的迪化街才能“闻到”。春节期间走进这条百年老街,叫卖声,声声入耳,来来往往的顾客,大包小包在手,人挤人。街两旁各式干货、小食等年货一应俱
“数字资源长期保存研究与实践”高级研讨班一、培训目的:近年来,随着信息技术和网络通信技术的飞速发展,数字化信息资源已逐步发展成为科技信息传播与利用的主要形式。同时,
期刊
本文针对目前普通高校公共体育课课程教材尚未见系统分析、无科学的评估方法的现状,在文献调研、问卷调查、专家访谈、数理统计和逻辑分析等方法的基础上,尝试运用模糊综合评
云南省的民国档案作为研究和认识云南地区民国历史的基础性资料和重要依据,将为云南地区的民国史研究提供最直接的原始性记录。然而在档案制成材料和外部保管环境等因素综合作
期刊