论文部分内容阅读
摘要:为了实现不同数字图书馆之间的检索,在对各图书馆网页cookie分析后,按照用户搜索条件将所搜索结果融合到一个页面中发馈给用户,方便用户的比较与使用。
关键词:数字图书馆;数据库;检索
中图分类号:G252.7文献标识码:A文章编号:1007-9599 (2011) 03-0000-01
Cross-database Searching of Digital Libraries
Sun Long,Shi Yan
(Qingdao University of Science & Technology,Qingdao266042.China)
Abstract:In order to search among different digital libraries,library web pages for each cookie in the analysis,according to user search criteria to the search results into a single page,send feedback to the user,Easy compare and use for users.
Keywords:Digital library;Database;Search
20世紀后半叶,随着信息技术的发展,需要传播储存的信息越来越多,其种类和形式也越加丰富;因此传统意义上的图书馆显然不能满足这些需要。而随着计算机技术和网络技术的发展和成熟数字图书馆的出现便很好的解决了以上问题。在国内外各类专业化的数字图书馆如雨后春笋相继成立。进入21世纪后,随着学科横向发展,单一查询某一领域资料的查询方式已经远远不能满足用户的需要。因此现在国外较有影响力的数字图书馆与各机构展开商业合作相互开放数据库进行跨数据库查询。例如目前走在前列有OCLC公司的Sitesearch、Endeavor公司的Encompass等。但是目前我国数字图书馆跨行业检索仅限于其自身数据库范围内检索而不能同时检索其他数字图书馆的馆藏内容。针对用户在使用数字图书馆过程中需要在不同图书馆之间重复搜索的现状,以及各数字图书馆数据库无法直接进行访问的现实,本软件通过对数字图书馆网页源代码的分析、加工,将用户所需搜索内容通过后台反馈到各数字图书馆。然后对各数字图书馆的搜索结果进行提取,把各家数字图书馆搜索结果加工融合到一个页面中反馈给用户,方便用户对搜索结果进行筛选比较,提取。在本程序网页首页同时为用户提供一个数字图书馆复选项,用户可以根据自己的需求、爱好来选取所要检索的数字图书馆,省略不必要的检索达到减少搜索时间效果。
一、我国目前主要的数字图书馆
目前我国主要的数字图书馆主要有以下几个:
(一)超星数字图书馆
由北京世纪超星信息技术发展公司投资兴建,2000年开通的数字图书图书馆。目前是最大的中文在线数字图书馆共收录数十万册电子图书,四百多万篇论文涉及社会科学、自然科学等各个学科门类。是国家“863”计划中国数字图书馆示范工程项目。
(二)万方数据知识服务
集纳了涉及各个学科的期刊、学位、会议、外文期刊、外文会议等类型的学术论文,法律法规,科技成果,专利、标准和地方志。收录各类期刊6千余种,其中核心期刊两千五百多种,论文总数量达一千多万篇,每年约增加二百余万篇。
(三)维普期刊
由重庆维普咨询有限公司创建,收录有中文期刊一万两千余种,中文报纸一千多种,外文期刊四千余种。
二、多种数据库的检索
现在国外较有影响力的数字图书馆与各机构展开商业合作相互开放数据库进行跨数据库查询。例如目前走在前列有OCLC公司的Sitesearch、Endeavor公司的Encompass等。但是目前我国数字图书馆跨行业检索仅限于其自身数据库范围内检索而不能同时检索其他数字图书馆的馆藏内容。
三、跨图书馆检索的实现
目前我国数字图书馆的检索用ASP实现,假设存储站内信息的数据库为wz.mdb,数据结构如下:
数字图书馆可以根据信息的分类进行检索,只要知道数据库的表的结构就可以进行检索,步骤为打开数据库——检索信息——显示结果给用户。
网站编码现在主要有两种一个是thm-8另一个是gb2312。不同的网站编码不同,不同的编码数据是不能共享的。编码常常在网站头部进行定义。在我实现的万方和超星数据资源共同检索时,万方数据库使用的THM-8编码,超星数字图书馆使用的是GB2312编码,要想在同一个网页中实现他们共同检索必须统一一种编码方式。在此我使用的是把万方数据库的编码方式转换成GB2312编码方式。在网页中如果实现汉字转换成THM-8再转换成GB2312的可以用此函数进行转换再进行搜索,还有需要把GB2312字符转换成THM-8再进行搜索的,可以用一下函数进行转换再进行搜索。
在我设计的首页进行搜索内容输入,提交到s.asp文件进行数据处理,再经过跳转到不同的页面进行数据检索。为了实现在不同数字图书馆进行相同检索并把检索结果回馈给用户,我设计并完成了多种数据之间的共享,给用户提供了方便,提高了我们检索结果的多样性和准确性,使得我们要检索的结果更加全面。在实现多种数据共享时我想提出自己在此次设计中方法——求同存异方法,所谓求同即使求的相同的检索结果,不同的数字图书馆得到相同的检索见过,存异即使不同的数字图书馆在框架结构下共同检索,把结果反馈给用户。在求同中利用了cookie进行数据共享,利用多个名单名称一致进行相同数据检索。在存异中框架可谓是一个很好的结构,网页中框架可以实现不同框架进行不同功能而且容易实现数据的共享。
四、结论
此次设计不同数字图书馆实现数据共同检索并在一个页面返回给用户,实现了我们的多种数据共享,完成了我们对多个数字图书馆的共同检索。在使用中方便了用户进行数字图书馆的检索。由于现在数字图书馆的不断发展,可在对特定数字图书馆网页进行分析后在本软件首页进行添加,进行检索的扩充。
参考文献:
[1]庞志永.基于Web的网络数据库系统的开发
[2]黄海.中文搜索引擎核心技术之争.图书馆杂志,2001,3
[3]刘晓清.怎样建设数字图书馆.北京:海洋出版社,2010
关键词:数字图书馆;数据库;检索
中图分类号:G252.7文献标识码:A文章编号:1007-9599 (2011) 03-0000-01
Cross-database Searching of Digital Libraries
Sun Long,Shi Yan
(Qingdao University of Science & Technology,Qingdao266042.China)
Abstract:In order to search among different digital libraries,library web pages for each cookie in the analysis,according to user search criteria to the search results into a single page,send feedback to the user,Easy compare and use for users.
Keywords:Digital library;Database;Search
20世紀后半叶,随着信息技术的发展,需要传播储存的信息越来越多,其种类和形式也越加丰富;因此传统意义上的图书馆显然不能满足这些需要。而随着计算机技术和网络技术的发展和成熟数字图书馆的出现便很好的解决了以上问题。在国内外各类专业化的数字图书馆如雨后春笋相继成立。进入21世纪后,随着学科横向发展,单一查询某一领域资料的查询方式已经远远不能满足用户的需要。因此现在国外较有影响力的数字图书馆与各机构展开商业合作相互开放数据库进行跨数据库查询。例如目前走在前列有OCLC公司的Sitesearch、Endeavor公司的Encompass等。但是目前我国数字图书馆跨行业检索仅限于其自身数据库范围内检索而不能同时检索其他数字图书馆的馆藏内容。针对用户在使用数字图书馆过程中需要在不同图书馆之间重复搜索的现状,以及各数字图书馆数据库无法直接进行访问的现实,本软件通过对数字图书馆网页源代码的分析、加工,将用户所需搜索内容通过后台反馈到各数字图书馆。然后对各数字图书馆的搜索结果进行提取,把各家数字图书馆搜索结果加工融合到一个页面中反馈给用户,方便用户对搜索结果进行筛选比较,提取。在本程序网页首页同时为用户提供一个数字图书馆复选项,用户可以根据自己的需求、爱好来选取所要检索的数字图书馆,省略不必要的检索达到减少搜索时间效果。
一、我国目前主要的数字图书馆
目前我国主要的数字图书馆主要有以下几个:
(一)超星数字图书馆
由北京世纪超星信息技术发展公司投资兴建,2000年开通的数字图书图书馆。目前是最大的中文在线数字图书馆共收录数十万册电子图书,四百多万篇论文涉及社会科学、自然科学等各个学科门类。是国家“863”计划中国数字图书馆示范工程项目。
(二)万方数据知识服务
集纳了涉及各个学科的期刊、学位、会议、外文期刊、外文会议等类型的学术论文,法律法规,科技成果,专利、标准和地方志。收录各类期刊6千余种,其中核心期刊两千五百多种,论文总数量达一千多万篇,每年约增加二百余万篇。
(三)维普期刊
由重庆维普咨询有限公司创建,收录有中文期刊一万两千余种,中文报纸一千多种,外文期刊四千余种。
二、多种数据库的检索
现在国外较有影响力的数字图书馆与各机构展开商业合作相互开放数据库进行跨数据库查询。例如目前走在前列有OCLC公司的Sitesearch、Endeavor公司的Encompass等。但是目前我国数字图书馆跨行业检索仅限于其自身数据库范围内检索而不能同时检索其他数字图书馆的馆藏内容。
三、跨图书馆检索的实现
目前我国数字图书馆的检索用ASP实现,假设存储站内信息的数据库为wz.mdb,数据结构如下:
数字图书馆可以根据信息的分类进行检索,只要知道数据库的表的结构就可以进行检索,步骤为打开数据库——检索信息——显示结果给用户。
网站编码现在主要有两种一个是thm-8另一个是gb2312。不同的网站编码不同,不同的编码数据是不能共享的。编码常常在网站头部进行定义。在我实现的万方和超星数据资源共同检索时,万方数据库使用的THM-8编码,超星数字图书馆使用的是GB2312编码,要想在同一个网页中实现他们共同检索必须统一一种编码方式。在此我使用的是把万方数据库的编码方式转换成GB2312编码方式。在网页中如果实现汉字转换成THM-8再转换成GB2312的可以用此函数进行转换再进行搜索,还有需要把GB2312字符转换成THM-8再进行搜索的,可以用一下函数进行转换再进行搜索。
在我设计的首页进行搜索内容输入,提交到s.asp文件进行数据处理,再经过跳转到不同的页面进行数据检索。为了实现在不同数字图书馆进行相同检索并把检索结果回馈给用户,我设计并完成了多种数据之间的共享,给用户提供了方便,提高了我们检索结果的多样性和准确性,使得我们要检索的结果更加全面。在实现多种数据共享时我想提出自己在此次设计中方法——求同存异方法,所谓求同即使求的相同的检索结果,不同的数字图书馆得到相同的检索见过,存异即使不同的数字图书馆在框架结构下共同检索,把结果反馈给用户。在求同中利用了cookie进行数据共享,利用多个名单名称一致进行相同数据检索。在存异中框架可谓是一个很好的结构,网页中框架可以实现不同框架进行不同功能而且容易实现数据的共享。
四、结论
此次设计不同数字图书馆实现数据共同检索并在一个页面返回给用户,实现了我们的多种数据共享,完成了我们对多个数字图书馆的共同检索。在使用中方便了用户进行数字图书馆的检索。由于现在数字图书馆的不断发展,可在对特定数字图书馆网页进行分析后在本软件首页进行添加,进行检索的扩充。
参考文献:
[1]庞志永.基于Web的网络数据库系统的开发
[2]黄海.中文搜索引擎核心技术之争.图书馆杂志,2001,3
[3]刘晓清.怎样建设数字图书馆.北京:海洋出版社,2010