用中文搜索英文?

来源 :互联网天地 | 被引量 : 0次 | 上传用户:changkou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  


  怎样让用户能跨语言进行搜索并获得更多信息?这项工作一直就是很多文化工作者的中心,为了解决语言之间的交互问题,甚至有一门被称为“机器翻译”的学科专门在研究。
  
  Google 的拥护者们总是津津乐道于Google的终极理想—“整合全世界的信息让每个人都能免费地随时取用。”这个理想看起来就好像当年的巴别塔,目标伟大但是困难重重。这其中首先要遇到的一个问题就是语言差异以及由此产生的文化理解差异。面对全世界众多的语言,怎样让用户能跨语言进行搜索并获得更多信息?这个工作一直就是很多文化工作者们的中心,为了解决语言之间的交互问题,甚至有一门被称为“机器翻译”的学科专门在研究如何解决这个问题。
  另一方面,如果需要把这样的需求用搜索引擎来实现的话,显然不是简单使用不同语言版本的搜索引擎获得不同语言的答案就可以解决的。我们想要的是输入中文,然后得到类似于英文的结果,不可能吗?
  
  简单的理论通道
  
  从理论上来说,跨语言翻译的功能并不复杂,其基本原理为,用户从人机界面输入搜索关键词,网站首先利用该关键词在母语版本的搜索引擎上搜索母语的结果,然后通过网站后台的机器翻译引擎将关键词翻译成目的语种,并将其送进目的语种版本的搜索引擎进行搜索,再将返回的结果通过某种整合形式融入到最终的搜索结果显示页面。
  跨语言翻译的原理如此简单,但从技术上实现却并不是件很容易的事情,其发展主要受制于机器翻译技术的进步。毋庸讳言,直到目前为止,机器翻译的效果尚停留在一个相对较低的水平,对于较短的单词、词组或短句的翻译还可以接受,如果句子稍长或者结构较复杂,那么翻译结果就不太尽如人意,由此得到的搜索结果也就可想而知。
  由于受制于其他技术的发展,因此跨语言搜索的进展相对于其他类型的搜索技术来说相对较慢。不过,随着搜索引擎所积累的数据越来越庞大,加上互联网上的照片数量也开始成几何级数增长,使得跨语言搜索可以逐渐开始扩大影响力。2008年12月底,Google正式推出了跨语言搜索功能,结束了长达数年的Beta版。而在此之前,已经有一个名为PanImages的图片搜索引擎部分实现了跨语言搜索。
  
  又是Google
  
  首先我们来看看PanImages。PanImages提供100多种国家语言的翻译,当用户输入关键字并选择其隶属于哪种语言以后,它会通过机器翻译将关键词转换成各个国家的语言,让用户选择。用户点击相应语言翻译,PanImages就将翻译之后的关键词在目前世界上领先的图片搜索Google图片搜索和Flickr图片搜索中进行相应的搜索,并通过分栏的方式返回相应的搜索结果。
  如果说PanImages的跨语言搜索还处在一个较低的水平上,那么Google借助其海量的搜索数据所实现的跨语言搜索就可以提供真正实用的功能了。用户只需在Google中输入一个搜索词组如中文的“谷歌”,并选择需要搜索的目标语种如英语,便可以轻松查找到包含“Google”关键词的网页。这样一来,用户就可以使用自己的母语来浏览国外网站,搜索到自己想要的所有资料。
  Google实验室产品主管Cyrus Mystry表示:“Google搜索应用计划混合3000万文件,当执行用户搜索时从各个服务器中实施搜索。”为了方便用户阅读,Google搜索服务还将使用翻译工具,将搜索到的结果自动翻译为用户定义的语言。目前Google跨语言搜索支持35种语言,包括简体中文、繁体中文、越南文、英文、印尼文、印度文、意大利文、希腊文、希伯来文、西班牙文、乌克兰文、斯洛伐克文、斯拉维尼亚文、塞尔维亚文、瑞典文、日文、葡萄牙文、挪威文、立陶宛文、拉脱维亚文和罗马尼亚文。
  在使用时,Google把搜索结果网页中的信息分为两栏,右侧为跨语言搜索到的原始网页,左侧则是翻译成为用户选择的语言,每一个网页的两种语言结果平行对应。如果用户认为Google翻译的查询关键词有误差,还可以对翻译结果人工进行编辑,再次要求Google根据新的关键词进行搜索。
其他文献
台湾鳖苗与湖南鳖苗的特点比较湖南省是我国大陆最早开展中华鳖人工繁殖、产苗量最多的省份,其鳖苗销售已辐射到全国各地。近几年由于养鳖业超速发展,鳖苗供不应求,“台湾鳖苗”
施用磷肥的十措施随着养殖业的发展,化肥养鱼在养殖业上越来越被重视。然而,人们只重视使用氮肥,而忽视磷肥的施用,相反,磷肥却被列为水体第一位限制性营养因素,需要量虽比氮少,但在
养殖淡水白鲳前景广阔江苏省如皋市多种经营管理局顾宏兵淡水白鲳,学名短盖巨脂鲤,又称"淡水鲳",原产于南美亚马逊河,是热带和亚热带的一种大型经济鱼类。1985年引人我国大陆。目前我国
(一) “科学猜想”是研究自然科学的一种广泛应用的思想方法,它不同于无根据的幻想,而有它的客观根据,它是科学性和假定性的辩证统一。这就是说,它是根据已知的科学原理和科
我在几何光学的复习中,运用平面上直线和园的关系,验证了产生全反射的条件。开始,我简单地复习了折射定律sini/sinr=n,并在黑板上作出已知光线由真空(或光疏媒质)进入光密媒
<正> 中国地理学会第四次全国代表大会暨1979年综合学术年会于1979年12日28日至1980年元月7日在广州举行。出席会议的有来自全国高等院校、科研单位、中学及其他有关一单位的
2007年7月9日,2007(上半年)中国互联网市场数据发布会暨2007中国互联网大会发布会在京隆重举行。中国互联网协会领导为发布会特别致辞,12家媒体对发布会进行了现场直播,30多家媒
为贯彻落实国家版权局、公安部、工业和信息化部关于开展打击网络侵权盗版专项治理“剑网行动“方案的要求,切实维护互联网健康发展环境,严厉打击网络环境下的各类侵权盗版行为
2011年3月底,搜狗正式推出搜狗高速浏览器30预览版。在坚持为网民提供高速双核的上网体验基础之上.搜狗高速浏览器3.0预览版首创“网页更新提醒”服务,继续引领国产浏览器创新升
2008年5月7日,网易旗下搜索引擎有道(www.yodao.com)宣布,通过在网易各系列电子邮箱产品中的集成嵌入,网易邮箱注册用户可以在邮箱中直接使用有道海量词典的中英文互译功能,同时,在网