可视化搜索引擎原型系统设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户：haifeng123456789

【摘要】

：

随着网络和信息技术的迅猛发展，互联网上的信息量呈爆炸式增长，面对网上海量的信息资源，传统搜索引擎以线性列表方式显示检索结果，不能揭示检索结果间的相互关系，而目前已有的可视

【作者】

：

周挽澜

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2007年期

【关键词】

：

搜索引擎可视化设计原型系统计算机情报检索系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络和信息技术的迅猛发展，互联网上的信息量呈爆炸式增长，面对网上海量的信息资源，传统搜索引擎以线性列表方式显示检索结果，不能揭示检索结果间的相互关系，而目前已有的可视化搜索引擎工具对大量检索结果的显示也不能兼顾全局与细节，用户很难对检索结果有较深的理解与把握。同时，用户对检索需求也不能准确表达，需要修改检索式进行反复检索，搜索引擎对用户修改检索式可提供适当的帮助。为了有效改善上述两个问题，进行可视化搜索引擎方面的研究有着重要的意义。本文借鉴了相关领域的研究成果，采用理论与实验相结合的研究方法，在总结信息可视化、信息检索方面的理论与技术成果的基础上，对信息检索可视化进行了探讨和研究，最后开发了可视化搜索引擎原型系统。本文首先从信息可视化的概念入手，对Card信息可视化简单参考模型进行了简要介绍，总结了目前信息可视化粗略的应用情况。进而就本文相关的信息检索向量模型、文档表示技术以及作为检索基础的相似度计算方法作了简要分析。然后本文依据Card信息可视化简单参考模型，结合信息检索技术，对信息检索可视化三个过程分别进行了研究，从理论角度分析了可视化搜索引擎设计与实现的相关内容。最后使用Java Servlet和Java Applet技术，开发设计了可视化搜索引擎原型系统。该可视化搜索引擎原型系统是一个可视化的元搜索引擎，以百度与Google为成员搜索引擎进行检索。通过聚类、特征提取分析检索备选词，通过可视化映射将信息映射为可视化结构。在客户端以可视化视图方式显示检索结果，并提供丰富的可视化交互操作，帮助用户理解检索结果集合、构造检索式。本文在实验系统的设计过程中，尝试使用MMD聚类算法结合K-means聚类算法的方法进行文本聚类，相对于单独使用K-means，聚类效果和聚类速度都得到了改善。针对搜索引擎需要解决的两个问题，实验系统尝试将关键词权值引入信息检索可视化中，反映检索结果与检索式关键词之间的联系，通过权值调整细化检索结果与检索式关键词的相关程度。另外，通过对检索结果聚类后提取特征词，为用户提供备选检索词，在帮助用户准确构建检索式上，取得了一定的改善效果。

其他文献

基于场理论的企业知识转移研究

随着知识经济的兴起,知识的价值开始显现,知识产品、知识服务的巨大成功使人们认识到知识的重要性,知识也逐渐取代物质资源成为企业获取竞争优势和效益的关键。企业对知识的积累和利用通过企业知识转移实现,而企业知识转移的发生需要一定的条件,这条件就是企业所构建的各种情境,也即企业中的各种场。场理论源于自然科学,随着管理科学、组织理论的发展,场理论逐渐蔓延到社会科学的体系中,尤其是在企业信息和知识管理领域应用

学位

场理论企业知识转移

中国图书馆学会专业图书馆分会、中国科学院国家科学图书馆2009年第4季度培训通知

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

中国科学院图书馆学专业图书馆国家科学图书馆培训

中国古代体育文献述论

以古代体育文献的演变轨迹为主线,揭示古代体育文化的繁荣情况,并对古代体育文献的价值进行分析,指出古代体育文献不仅是研究我国文明史所必须利用的资料,同时也是促进今天的

期刊

中国古代体育体育文献价值

中国科技情报(科技信息)事业与中国情报学的学科定位所在(Ⅱ)——中国情报学的学科定位探寻:多个视角分析

依据中国科技信息事业在本质上属于软科学研究机构范畴这一客观事实,从软科学、智能科学和信息科学的视角对以该事业为重要实践基础和来源的中国情报学学科定位进行界定,指出

期刊

情报学学科定位软科学智能科学信息科学

基于领域范式演化的领域分析数据集界域研究

针对日益交叉模糊的领域边界问题,从理论上探索领域分析数据集的边界和疆域.从交叉学科范畴角度,研究不同交叉学科范畴的领域范式对应的数据集应该包含的关键要点,期望为情报

期刊

情报研究领域分析数据集

主要进口商品海关预警(2014年5月至2014年10月)

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

卷卷主要进口商品雄雄统计司海关总署口口红黄

信号分析:竞争情报研究的又一重要课题

从信号的涵义和分类、产生和发现、搜集和处理、分析和辨识、理论及应用5个方面介绍中外学者的研究成果,旨在引起企业情报人员和情报理论工作者的兴趣和关注,结合情报学和相

期刊

信号分析情报分析竞争情报

我国情报学共同体的历史源流

我国情报学历史源流主要有图书馆领域、技术领域、决策咨询领域和管理领域.每个领域都把自身的独特理论与理念融入到情报学理论构建中,形成各具特色的情报学共同体.这些共同

期刊

中国情报学学科共同体历史源流

常州地方文献及其工作研究

本文在国内外有关地方文献概念的基础上提出了常州地方文献的概念，界定了常州地文献的相关范围，指出常州地方文献是有关常州地区的一切资料，它包括常州地方史料、常州地方人物与

学位

地方图书馆文献资源信息开发地域特色网络合作

信息运动生态协同演进论纲

主要结合国内外研究状况,以场论、集合论、价值链理论和协同学等不同学科的基本理论作为研究基础,在对信息运动生态研究状况进行揭示的同时,着重就信息场中的拓展与收缩、信

期刊

信息场信息生态位信息生态链信息运动生态

可视化搜索引擎原型系统设计与实现

与本文相关的学术论文