多语言信息存取的潜在用户调研

来源 :知识管理论坛 | 被引量 : 0次 | 上传用户:starboyak
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】以问卷方式调查英国谢菲尔德大学中国留学生的检索信息习惯与偏好、存在的问题和对多语言信息存取功能的需求。结果发现他们对翻译工具依赖性较强,相比生成英文检索词,对检索结果的阅读和理解更困难些;总体上,留学生对多语言信息存取功能的需求不是很强烈,较专业和较准确的翻译工具对提高信息利用的效率会有很大帮助。
  【关键词】多语言信息存取 跨语言信息检索 数字图书馆 留学生
  1前言
  多语言信息存取(multilingual information access,MLIA),指所有涉及存取、查询和检索语种不同于查询提问式的文献集合的相关方法和技术,包括字体编码、语言识别、多语种文档标引、跨语言信息检索等[1-2]。其中,跨语言信息检索(cross-language information retrieval,CLIR)特指用一种语言(源语言)查询提问去检索其他语种(目标语言)信息资源的技术[1,3]。数字图书馆是MLIA的重要应用领域,在英语国家、日本和印度等地,特别是语言情况比较复杂的欧洲,已有很多相关研究立项,如欧盟联机目录的跨语言检索项目CACAO、文化遗产多语言检索项目MultiMatch、欧洲数字图书馆项目TEL等。尽管在个别高校图书馆已有实际应用[4],该服务却未得到广泛推广,除了技术原因外,还需进一步明确潜在用户群。
  近年来,到英语国家深造的中国留学生人数迅速增加。以英国为例,2010年来英的中国学生人数达到67 000人,比前一年增加18.1%,在英国海外学生中比例最高,约为15.7%[5]。每年激增的中国留学生已经成为英语国家高校图书馆的主要用户群之一。先前研究表明,中国留学生检索英文信息时存在一些困难[6-7],但他们是否需要图书馆提供一定的MLIA辅助功能还未见系统的调查,因此本文以英国谢菲尔德大学的中国留学生为例,调查了他们的信息检索行为和偏好、存在的问题和对MLIA基本功能的需求,此调查不仅有利于确认MLIA技术的潜在用户,也能为改善数字图书馆的功能和服务提供依据。谢菲尔德大学是英国招收海外学生最多的高校之一,庞大的中国留学生群体为本调研提供了充足的数据来源。
  2研究方法
  2.1 问卷设计与回收
  问卷分为5部分:用户背景和语言技能、中外文信息检索行为、对翻译工具的依赖、信息检索障碍、MLIA功能偏好。语言技能考察了与英文信息检索相关的写作能力和阅读能力,采取六点李克特量表,明确定义各级别代表的含义。在阅读水平量表中,1=“只能理解日常词汇和短语”,6=“能理解几乎所有东西,但不如母语那样流利”;写作水平量表中,1=“不会英文写作”,6=“能流利和精确地写作专业学科命题的文章”,高分数代表更高的语言流利度。
  问卷以在线和手工发放两种形式回收,在线问卷投放在问卷调研网站“问卷星”上,通过谢菲尔德大学邮件列表发送邀请给全校师生,请中国留学生到链接地址回答问卷;手工发放主要在图书馆和课堂前完成。问卷回收时间从2012年5月14日到6月14日,网上回收54份,手工回收97份,其中5份因内容不全被剔除,因此有效问卷共计146份。
  2.2 统计工具与方法
  统计所使用软件为SPSS。由于处理的数据是从5点李克特量表所得到的定序数据(ordinal data),本文采用非参数检验方法Spearman相关系数统计两因素之间是否存在显著关系,用Kruskal-Wallis test检验分类变量(包括英语水平、性别、年龄、学科类别、教育层次和留学英语国家时间)中不同类别的用户对MLIA功能需求是否存在显著差异,如果(P<0.05),则推测为差异显著[8],以发现各分类变量对MLIA功能需求的预测作用。其中英语水平系数和MLIA功能需求系数均采取加权方法,取量表得分的和。
  3调查结果分析
  3.1 用户背景
  在146个被调查对象中,大部分为女性(67.1%),并以18-24岁年龄组(74.7%)和25-34岁年龄组(22.6%)居多,35岁以上者只有4人。其中,本科生(29.5%)、硕士研究生(55.5%)、博士生(9.6%)占绝大多数,其他人员为访学人员(5.5%)。他们分别来自43个不同专业,其中从事社会科学领域学习和研究的人居多(58.2%),其次为理工科(23.3%)和人文艺术学科(18.5%)。总体上看,所调研的中国留学生在英语国家居住时间分布较为均匀,一年以内占48%,一年到两年时间占30.1%,两年以上占21.9%。
  从调查对象对自身英语水平的评估看,他们对自己的英文阅读和写作水平非常自信,阅读水平勾选4分以上者占94.5%,写作水平4分以上者占97.3%,均值分别为4.90和4.82。
  3.2 中英文信息检索目的与种类比较
  3.2.1 中英文信息检索目的
  关于留学生检索中英文信息的目的,调查结果见图1。中英文信息检索的目的呈现出相似的特征,即以学习、娱乐和购物为主。但是在检索娱乐信息时,接近90%的人倾向于使用中文信息源,使用英文信息的人数则只占60%。而学习和购物目的的信息检索,查找英文信息的人数较多,但差距不大。这一结果表明,留学生虽然身处英文生活和学习环境,他们仍然大量使用中文信息,特别是在休闲和娱乐时。
  3.2.2 检索中英文信息的种类和频次
  问卷以5点李克特量表提问了留学生检索以下信息种类的频次,从表1中的均值看,其检索英文书籍和文章的频次比中文高,介于3分(“有时”)和4分(“经常”)之间,而检索中文音视频和图像频次明显高于英文,这一结果进一步印证了图1的调查结果,因为书籍和期刊、会议论文是主要的学习参考信息源,音视频和图像则主要用于娱乐目的。此外,他们检索网页信息最为频繁,而且两种语种的使用频次差别不大。   3.3 学术信息检索用语言偏好
  当被问及“检索学术信息时,您更倾向于使用哪种语言”时,116名留学生选择了英文,占81.1%。只有27人选择了中文,没有人选择其他语种。
  优选英文执行检索的理由,按人数自高到低为:“因为我的专业领域中的大部分信息是以该语种写的”(90人);“一般情况下,用该语种我能找到更多信息”(84人);“因为我现处在该语种的学习和工作环境中”(73人);“因为老师要求我参照该语种的信息资源”(32人)。
  优选中文执行检索的主要理由包括:“因为它是我的母语”(25人);“因为一般情况下,用该语种我能找到更多信息”(13人),经过进一步确认,选择此项的学生中有5人学习中文相关专业,包括“东亚经济”和“对外汉语教学”。
  以上结果表明,大部分留学生能积极主动地适应英文学习环境,检索和利用英文信息,只有少数仍然习惯于用中文执行检索。
  3.4 对翻译工具的依赖
  当被问到“查找英文信息时,通常您借助翻译工具形成查询词的频次如何”时,只有大约28%的调查对象很少或从未使用过翻译工具,三分之一以上被调查者经常或频繁使用翻译工具,另外三分之一被调查者有时会用到翻译工具(见图2)。他们产生英文检索词所借助的外界方法包括:73.3%的留学生使用在线翻译服务(如Google Translate),54.1%的人使用电子词典,其次为“从阅读的文献中选取”(23.3%)、“问其他人”(8.9%)、“老师提供”(4.8%)。
  在使用过翻译工具的人群中,当被问及翻译工具是否有帮助时,只有41.1%认为比较有用或非常有用,其余人持中立或者否定态度(见图3)。问卷以开放填空题询问了被调查人员持中立或否定态度的原因。共有45人提供了反馈,总结起来主要有两种原因:翻译结果不是很准确,也不够专业。
  以上结果说明,形成查询提问式时,中国留学生对翻译工具的依赖性很强,但是大部分人对翻译工具的效果不是很满意。更准确和更专业的翻译工具对多数留学生来说会很有帮助。
  3.5 英文信息检索困难
  由表2可知,留学生在检索英文信息时遇到如下困难的频次均值均小于5点李克特量表中的3分(量表与图2中相同),这表明他们对检索英文信息比较自信;其中“不知道如何使用检索工具”的平均分最低,为1.90分,且众数为1,表明操作英文信息检索系统对留学生的阻碍最小。检索结果的检查和理解阶段遇到的障碍频次均值高于查询关键词形成阶段,对留学生来说,阅读和理解英文文献存在的问题似乎更为突出。
  3.6 对多语言信息存取基本功能的需求
  MLIA需求量表考察了最基本的数字图书馆多语言信息存取功能,使用5点李克特量表,请留学生打分,1分代表“完全不需要”,5分代表“非常需要”,高分数代表对MLIA功能更大的需求程度,另外设置0代表“不确定”。
  除去对MLIA功能表示“不确定”的18人,表中的均值、中数和众数均是在剩余128名留学生的评分基础上统计得出的。他们对各项功能的需求程度打分均值接近3分,意味着从总体上看,他们认为这些功能有一定的必要性,但需求程度不是很强高。对第二和第三个功能选择“不确定”的人数明显比其他功能要多,这可能由于两者均以假设系统提供有跨语言信息检索(CLIR)功能为前提。
  从均值看,留学生对检索结果的翻译功能需求程度较检索提问式的自动翻译功能(即CLIR功能)的需求更大。这进一步说明,用户在阅读检索结果时,更需要一些翻译辅助功能,机器翻译可能会有很大帮助。留学生对信息检索系统界面语种选择功能的打分最低,进一步表明操作英文检索系统已不是主要问题。相比之下,他们对检索结果按语种过滤功能要求较高。
  4结语
  本研究调查了在英国谢菲尔德大学留学的中国学生检索信息的习惯和偏好、遇到的困难以及对MLIA功能的需求。从调查结果看,留学生检索中英文信息的主要目的均为学习、娱乐和购物,其中用中文检索娱乐信息较使用英文的人数更多些,尽管以学习为目的的信息检索使用两种语言的人数差别不是很大,但在检索学术信息时,绝大多数人会优选英文执行检索。
  尽管留学生对他们的英语水平较为自信,但大部分人在形成查询提问式时对翻译工具很依赖,却对翻译效果并不满意。在他们遇到的检索困难中,对检索结果的阅读和理解相比形成英文查询词的困难更严重些,在MLIA功能的选择上,对检索结果的翻译功能需求也较查询提问的自动翻译功能(CLIR功能)更强烈些,机器翻译对提高留学生的信息利用效率可能会有很大帮助。
  在所考察的因素中,只有英语水平与MLIA功能需求关系最显著,是判断对MLIA功能需求的最重要因素。从总体上看,留学生对MLIA功能有一定需求,但不是很强烈。其原因是由于英语水平较高还是由于对MLIA功能的效率存有怀疑还需进一步考察。值得肯定的是,他们需要更“专业”和更“准确”的翻译工具。例如, CNKI在专业论文基础上统计生成的“CNKI翻译助手”,如能嵌入到英文信息检索系统中,对用户产生英文查询词会是很好的参照。
  在本文的探索性研究基础上,未来还需要以用户实验进一步考察使用跨语言信息检索和机器翻译对提高留学生检索效率的作用。
  [参考文献]
  [1] Peters C, Sheridan P. Multilingual information access[J]. Lectures Notes in Computer Science, 2001,(1980):51-80.
  [2] Oard D W. Multilingual information access[M]// Bates M J, Maack M N. Encyclopedia of Library and Information Sciences. New York: Taylor & Francis, 2009.   [3] Oard D W. Serving users in many languages, cross-language information retrieval for digital libraries [EB/OL]. [2012-08-02].http://www.dlib.org/dlib/december97/oard/12oard.html.
  [4] Bernardi R, Calvanese D, Dini L, et al. Multilingual search in libraries: The case-study of the Free University of Bozen-Bolzano[C]// Fellbaum C, Miller G. LREC 2006 proceedings,European Language Resource Association,Genoa,Italy, 2006:2287-2290.
  [5] Internet World Stats [EB/OL].[2012-08-10].http://www.intenetworldstats.com/stats7.htm.
  [6] Liao Yan, Finn M, Lu Jun. Information-seeking behaviour of international graduate students vs. American graduate students: A user study at Virginia Tech 2005 [J]. College and Research Libraries, 2007, 68(1):5-25.
  [7] Mehra B, Bilal D. International students' perceptions of their information seeking strategies [C]// Dalkir K, Arsenault C. Proceedings of the 35th Annual Conference of the Canadian Association for Information Science(CAIS/ACSI): Information Sharing in a Fragmented World: Crossing Boundaries, Montreal, 2007:10-12.
  [8] Field A. Discovering statistics using SPSS[M]. London: Sage Publications, 2005: 548-549.
其他文献
摘要:[目的/意义]本研究针对我国信息产业发展状况,采用内容分析法对国内信息产业领域研究文献进行深度分析,从而发现我国信息产业研究热点和发展趋势。[方法/过程]采用共词分析法和概念网络分析法对中国知网中信息产业研究相关的文献进行关键词和主题分析,总结出我国信息产业政策领域研究热点集中在信息技术产业化发展、信息化与信息安全、信息资源开发与规划、政府信息服务、信息政策、区域一体化中的信息产业规划这6个
期刊
编者按:人们常说:商场如战场。面对风云诡谲的市场变化、突飞猛进的技术发展、日新月异的社会变迁,任何企业在快速成长的过程中,都不会是一帆风顺或一劳永逸,而是需要时时面对各种竞争、挑战和问题。在这种情形下,企业要想赢得竞争并保持基业长青,就需要像在战场上掌握和运用兵法一样,掌握一系列的前进策略和问题解决之道。  自20世纪90年代以来,“知识管理”已经成为企业界重要的管理工具之一。随着越来越多的中国企
期刊
【摘要】  学士学位论文仓储的基本形式是论文题录库、优秀论文全文库合二为一。建立完善、稳定的学士学位论文数据采集链,是构建学士学位论文仓储的必要前提。区域性优秀学士学位论文全文数据库具有较强的建设价值,做好包括建设目标、合作框架、合作平台、建设标准等内容在内的项目顶层设计至关重要。开放获取是学士学位论文仓储发展的必然趋势,采用开放存取模式建设学士学位论文仓储,须结合相关法律和开放存取政策等进行有效
期刊
摘要:通过问卷调查、归纳、演绎和比较分析,探讨大学生使用移动搜索的特征、所用移动设备的性能、对智能手机应用程序的使用情况、利用手机搜索引擎等方面对用户体验的影响,并对手机搜索存在的问题提出优化建议。认为手机搜索速度慢、准确性差严重影响了搜索体验,多开发社交软件有助于提高用户体验。  关键词:移动搜索 智能手机应用程序 特征因子  1 引 言  移动搜索是通过移动通信与互联网的对接,将网页内容转换为
期刊
编者按:2010年以来,一位来自海峡对岸的老师开始出现在大陆企业知识管理界和培训界的视野之中:他用一双冷静的眼和一颗热情的心关注着大陆知识管理的腾飞,他带着“跨界思维”跨越海峡,为大陆知识管理研究与实践带来全新的视角,仿佛带来一缕来自太平洋的清新海风,为我们不断拓展着知识管理的“宽度”;他从智慧层面关照知识,从时代、从世代、从社会进步、从人生进化的角度认识知识管理,为我们不断提升着知识管理的“高度
期刊
对国内外网络视频公开课的发展历程、现状、运行模式等进行阐述,对国内外网络地球科学学科视频公开课进行统计分析,并结合地质图书馆现状提出建设地学视频资源库的设想,探讨地学网络视频建设的关键性问题和实施方案。
期刊
摘要:[目的/意义] 从个体角度分析团队成员之间的合作关系,揭示科研团队的内部合作特征,为科研团队的遴选、建设和成果验收提供依据。[方法/过程]分别在成果数量和合作人数这两个维度上对团队成员进行切分,在第一个维度上切分出零产成员和高产成员,在第二个维度上切分出孤立成员和活跃成员,然后以39个国家自然科学基金创新研究群体为样本,分析零产成员和孤立成员的数量,以及学术带头人与高产成员、活跃成员的关系。
期刊
>>【摘要】  指出网络化、信息化给图书馆事业发展带来了新的挑战,管理转型是城市图书馆适应新生存环境的重要出路。以东莞图书馆的具体做法为例,分析城市图书馆管理转型的主要内容,包括战略管理、流程管理、绩效管理三个主要方面,并且提出了一些问题与思考。  >>【关键词】  网络信息环境 城市图书馆 管理转型 东莞图书馆 战略管理 流程管理 绩效管理  1 城市图书馆面临的网络信息环境  1.1 信息化浪
期刊
【摘要】  借鉴社会网络理论方法,基于显、隐知识流向分析,提出一种跨组织协作中知识缺口和显、隐知识平衡的量化分析方法,通过构建跨组织显、隐知识流对比矩阵,从个体和群体两个层面对跨组织知识缺口和显、隐知识流平衡状况进行度量分析,指导跨组织协作和知识共享的改进。最后通过一个案例验证此方法。  【关键词】  跨组织协作 知识缺口 显性知识 隐性知识 知识流 知识共享  为了应对日益开放和复杂的商业环境,
期刊
摘要:[目的/意义]突发公共卫生事件嚴重危及全球社会公众的生命健康。实现信息资源对突发事件的智能存储、查询和知识组织与输出等,对应急领域科研数据集成共享与领域知识管理具有重要的参考意义。[方法/过程]选取CNKI和WOS为检索平台,对突发公共卫生事件进行检索,爬取有效数据,利用文献计量软件对抽取的知识数据进行加工、融合,并对高频词汇、文献作者和机构进行聚类可视化分析,将知识实体、属性及关系存储于N
期刊