数字图书馆跨库检索初探

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:gaozhanlong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:为了实现不同数字图书馆之间的检索,在对各图书馆网页cookie分析后,按照用户搜索条件将所搜索结果融合到一个页面中发馈给用户,方便用户的比较与使用。
  关键词:数字图书馆;数据库;检索
  中图分类号:G252.7文献标识码:A文章编号:1007-9599 (2011) 03-0000-01
  Cross-database Searching of Digital Libraries
  Sun Long,Shi Yan
  (Qingdao University of Science & Technology,Qingdao266042.China)
  Abstract:In order to search among different digital libraries,library web pages for each cookie in the analysis,according to user search criteria to the search results into a single page,send feedback to the user,Easy compare and use for users.
  Keywords:Digital library;Database;Search
  20世紀后半叶,随着信息技术的发展,需要传播储存的信息越来越多,其种类和形式也越加丰富;因此传统意义上的图书馆显然不能满足这些需要。而随着计算机技术和网络技术的发展和成熟数字图书馆的出现便很好的解决了以上问题。在国内外各类专业化的数字图书馆如雨后春笋相继成立。进入21世纪后,随着学科横向发展,单一查询某一领域资料的查询方式已经远远不能满足用户的需要。因此现在国外较有影响力的数字图书馆与各机构展开商业合作相互开放数据库进行跨数据库查询。例如目前走在前列有OCLC公司的Sitesearch、Endeavor公司的Encompass等。但是目前我国数字图书馆跨行业检索仅限于其自身数据库范围内检索而不能同时检索其他数字图书馆的馆藏内容。针对用户在使用数字图书馆过程中需要在不同图书馆之间重复搜索的现状,以及各数字图书馆数据库无法直接进行访问的现实,本软件通过对数字图书馆网页源代码的分析、加工,将用户所需搜索内容通过后台反馈到各数字图书馆。然后对各数字图书馆的搜索结果进行提取,把各家数字图书馆搜索结果加工融合到一个页面中反馈给用户,方便用户对搜索结果进行筛选比较,提取。在本程序网页首页同时为用户提供一个数字图书馆复选项,用户可以根据自己的需求、爱好来选取所要检索的数字图书馆,省略不必要的检索达到减少搜索时间效果。
  一、我国目前主要的数字图书馆
  目前我国主要的数字图书馆主要有以下几个:
  (一)超星数字图书馆
  由北京世纪超星信息技术发展公司投资兴建,2000年开通的数字图书图书馆。目前是最大的中文在线数字图书馆共收录数十万册电子图书,四百多万篇论文涉及社会科学、自然科学等各个学科门类。是国家“863”计划中国数字图书馆示范工程项目。
  (二)万方数据知识服务
  集纳了涉及各个学科的期刊、学位、会议、外文期刊、外文会议等类型的学术论文,法律法规,科技成果,专利、标准和地方志。收录各类期刊6千余种,其中核心期刊两千五百多种,论文总数量达一千多万篇,每年约增加二百余万篇。
  (三)维普期刊
  由重庆维普咨询有限公司创建,收录有中文期刊一万两千余种,中文报纸一千多种,外文期刊四千余种。
  二、多种数据库的检索
  现在国外较有影响力的数字图书馆与各机构展开商业合作相互开放数据库进行跨数据库查询。例如目前走在前列有OCLC公司的Sitesearch、Endeavor公司的Encompass等。但是目前我国数字图书馆跨行业检索仅限于其自身数据库范围内检索而不能同时检索其他数字图书馆的馆藏内容。
  三、跨图书馆检索的实现
  目前我国数字图书馆的检索用ASP实现,假设存储站内信息的数据库为wz.mdb,数据结构如下:
  数字图书馆可以根据信息的分类进行检索,只要知道数据库的表的结构就可以进行检索,步骤为打开数据库——检索信息——显示结果给用户。
  网站编码现在主要有两种一个是thm-8另一个是gb2312。不同的网站编码不同,不同的编码数据是不能共享的。编码常常在网站头部进行定义。在我实现的万方和超星数据资源共同检索时,万方数据库使用的THM-8编码,超星数字图书馆使用的是GB2312编码,要想在同一个网页中实现他们共同检索必须统一一种编码方式。在此我使用的是把万方数据库的编码方式转换成GB2312编码方式。在网页中如果实现汉字转换成THM-8再转换成GB2312的可以用此函数进行转换再进行搜索,还有需要把GB2312字符转换成THM-8再进行搜索的,可以用一下函数进行转换再进行搜索。
  在我设计的首页进行搜索内容输入,提交到s.asp文件进行数据处理,再经过跳转到不同的页面进行数据检索。为了实现在不同数字图书馆进行相同检索并把检索结果回馈给用户,我设计并完成了多种数据之间的共享,给用户提供了方便,提高了我们检索结果的多样性和准确性,使得我们要检索的结果更加全面。在实现多种数据共享时我想提出自己在此次设计中方法——求同存异方法,所谓求同即使求的相同的检索结果,不同的数字图书馆得到相同的检索见过,存异即使不同的数字图书馆在框架结构下共同检索,把结果反馈给用户。在求同中利用了cookie进行数据共享,利用多个名单名称一致进行相同数据检索。在存异中框架可谓是一个很好的结构,网页中框架可以实现不同框架进行不同功能而且容易实现数据的共享。
  四、结论
  此次设计不同数字图书馆实现数据共同检索并在一个页面返回给用户,实现了我们的多种数据共享,完成了我们对多个数字图书馆的共同检索。在使用中方便了用户进行数字图书馆的检索。由于现在数字图书馆的不断发展,可在对特定数字图书馆网页进行分析后在本软件首页进行添加,进行检索的扩充。
  参考文献:
  [1]庞志永.基于Web的网络数据库系统的开发
  [2]黄海.中文搜索引擎核心技术之争.图书馆杂志,2001,3
  [3]刘晓清.怎样建设数字图书馆.北京:海洋出版社,2010
其他文献
本文就如何用好初中化学课程标准、考试说明、化学教材、教师用书和教辅材料“五本书”服务课堂教学进行了全面阐释,对初中化学教师提高课堂教学效益、提升教学质量有一定的参
化学课堂教学方法更新与优化,可以为化学课堂教学带来重要增长点.教师科学导入、明确目标、优化引导、合理运用教具、升级课堂评价,都属于课堂教学方法运用范畴,只有精心选择,才能
现有的手工统计信息的方法数据融合度差、分析和展示方法陈旧贫乏,已难以满足信息量日趋庞大。统计结果复杂的统计应用需求。备政府职能部门对统计信息系统的需求日益迫切的背
基于线程的多任务,是一种充分、合理利用计算机资源,提高工作效率的重要手段。多线程编程技术避免了某项任务长期占用CPU时间,既提高了程序的性能,又增强了程序的功能,实现了一些
传统的化学教学模式已经不再符合新课程标准的要求,仅仅为了中考而教学的目标早应当摒弃.教师可以通过自主实验来培养学生们的观察能力、动手能力和演绎归纳推理能力,从而提升学
计算型选择题是各种考试常见的题型,并且在各种试卷所占的比例都较大,因此应该引起高度的重视.为使学生能够准确、快速地解决此类问题,下面把解决此类问题的方法进行归纳.
高尔基说过:"最难的是开始,就是第一句话,如同音乐上一样,全曲的音调都是它给予的,平常得好好去找寻它."课堂教学也如同弹奏乐曲,成功的新课导入对激发学生学习兴趣、调动学生学
摘要:蚁群算法是意大利学者Dorigo于1991年提出的一种模拟进化算法,蚁群算法提出后却在组合优化中获得广泛的应用,如调度、二次分配和网络路由等,本文將蚁群算法进行改进并应用于PID控制器优化,得到了良好效果。  关键词:蚁群算法;指导变异;PID  中图分类号:TP301.6 文献标识码:A 文章编号:1007-9599 (2012) 10-0000-02
摘要:本文从设计模式的观点分析了TWaver的架构,重点详细探讨了其MVC的设计模式,数据元素与数据容器,以及事件驱动机制等原理。  关键词:设计模式;MVC;Twaver  中图分类号:TP311.52 文献标识码:A 文章编号:1007-9599 (2012) 13-0000-02  一、引言  TWaver是美国Serva Software公司的产品,是应用最为广泛的电信专业图形界面开
有关阴影部分面积的问题已成为中考命题的热点,其主要考查学生的思维和综合运用数学知识的能力.一、等积变形法利用“等底、等高的两个三角形面积相等”,将不规则图形转化为便于