语义网概念体系的应用案例分析

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:glamour269
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]语义网概念体系是计算机科学的新兴研究方向,旨在使机器理解互联网上的信息。本文介绍了语义网及其体系结构,概念体系及其描述语言,并分析了语义网概念体系在搜索引擎优化领域与人工智能研究领域的实际应用案例,为语义网概念体系的研究者提供一些案例参考,最后提出了未来可应用的一些领域。
  [关键词]语义网;概念体系;本体;搜索引擎;知识图谱
  中图分类号:H313 文献标识码:A 文章编号:1009-914X(2017)21-0208-02
  语义网概念自提出以来,已经成为新一代互联网技术应用的热点。搜索引擎,包括谷歌、百度、搜狗、新一代计算知识引擎Wolfram Alpha,还有认知计算系统的杰出代表IBM Watson都使用了语义网技术。
  1.语义网及其体系结构
  互联网技术的发展给人们带来方便的同时也逐渐暴露了一些问题。互联网数据呈爆炸式增长,使得用户难以准确檢索出所需信息。解决这类矛盾的基本方法是变无序信息为有序信息,让计算机能够理解互联网上的数据与信息,这就是语义网的终极目标。
  语义网是新兴研究方向,旨在使互联网上的文本信息具有计算机系统可以理解的语义。这一概念由万维网之父Tim Berners-Lee提出[1]。Berners-Lee还提出,语义网体系结构是互联网未来发展的一个方向,它是基于语义的体系结构。该体系中由高向低分别是:UNICODE(统一码)、URI(统一资源标识符)、XML(可扩展标记语言)、RDF(资源描述框架)、Ontology(概念体系)、Logic(逻辑)、Proof(校验)和Trust(信任)[2]。在语义网体系结构中,第一层UNICODE和URI,第二层XML、NS和xmIschema,第三层RDF和rdfschema。Ontology vocabulary就是语义网体系结构的第四层,第五层到第七层,它们以第一层到第四层为基础进行逻辑推理操作,并对推理结果进行验证,证明其有效性。语义网的核心层就是可扩展标记语言XML、资源描述框架RDF和概念体系Ontology,它们所表示的是网络信息的语义。
  2.概念体系及其描述语言
  Ontology即“概念体系”。从哲学概念上来说,Ontology是对客观存在的系统解释或说明,关心的是客观现实的抽象本质。同时也存在“本体”或“本体论”的译法,但都沿用了哲学上的概念,不利于人们对于计算机科学中Ontology的理解,所以本文采用“概念体系”的译法。
  概念体系旨在克服计算机系统之间的“语义鸿沟”,它的概念始于哲学,定义是“对世界上客观存在物的系统地描述”[3]。“概念体系是概念模型的明确的规范说明[4]”,这是最为流行的概念体系定义,1993年由Gruber给出。
  3.语义网概念体系的实际应用案例
  语义网概念体系实际应用非常广,尤其是在搜索引擎优化领域与人工智能研究领域。
  3.1.利用语义网概念体系进行搜索引擎优化
  目前使用使用语义网概念体系的搜索引擎主要有:谷歌、百度、搜狗,还有计算知识引擎(Computational Knowledge Engine)Wolfram Alpha等。
  案例1:Wolfram Alpha是一种计算知识引擎。用户可以在网站中的搜索界面提交查询请求和计算要求。Wolfram Alpha能夠根据用户输入的请求识别出用户真正需要的信息,然后利用内置知识体系进行计算,最后在搜索结果中直接为用户提供答案。答案的表示方式多种多样,有文字、图表、数据或图形。与传统通用搜索引擎相比,Wolfram Alpha可以在较短时间内为用户整理好答案并返回结果,而不是匹配的的网页链接和网页摘要。
  3.2.就体验效果而言,Wolfram Alpha有一些优势
  如:
  (1)增强检索结果的逻辑性。Wolfram Alpha使得计算机能够理解用户需要检索的问题,对搜索问题进行自动识别给出更加智能的答案;
  (2)节省用户大量的时间和精力。用户不需要花费更多时间筛选检索结果中的各种网页,可以直接得到答案;
  (3)具有更好的模糊语义识别功能。如果输入“抛10次,4次正面向上”,Wolfram Alpha可以识别出用户搜索的其实是抛硬币的概率问题。
  但它也存在一些缺点:
  (1)搜索结果数据更新不及时。Wolfram Alpha在效果上类似于维基百科、百度百科等百科知识网站,它对数据库中的共时数据与历时数据进行概念体系构建,网站工作人员需要大量时间和精力来更新共时数据;
  (2)搜索结果不够全面。因为Wolfram Alpha可以直接显示需要的答案,没有用户参与筛选结果,或许对于用户来说不是最理想的答案。
  由于语义网概念体系应用时间较短,所以在实际应用时会出现很多问题,这就需要语义网概念体系技术的前沿企业与机构及时进行技术创新。
  案例2:谷歌搜索引擎可以进行知识图谱(Knowledge Graph)搜索,它将检索结果的显示方式进行知识系统化,任一关键词都有一个完整的知识体系。
  与以前的检索结果相比,“知识图谱”将在以下方面提高检索效果:
  (1)提高检索结果准确性。由于一个关键词可能具有多重含义,所以知识图谱会将最全面的信息展现出来,让用户找到自己最需要的含义。
  (2)为用户提供更全面的总结。利用知识图谱,谷歌可以更好的理解用户搜索的信息,并总结出相关信息、数据或图表。例如,当用户搜索关键词“Albert Einstein”(阿尔伯特·爱因斯坦)时,搜索结果不仅包括他的身高、体重、照片、家庭成员等个人信息,还有科学贡献时间线、重要科学贡献、诺贝尔获奖情况等。   (3)检索结果会扩展用户视野。由于“知识图谱”会给出搜索结果的完整知识体系,所以用户往往会发现很多陌生的知识。如果用户搜索“subway”,会检索出它不止是“地铁”的意思,还是快餐品牌“赛百味”的英文名。
  不仅国外有一些机构和公司使用知识图谱技术,如Facebook Graph Search,而且国内有一些公司在使用此类技术,如搜狗知识图谱“知立方”和百度知识图谱,它们将语义网概念体系技术应用到搜索引擎中,以提高检索效率。
  3.2 利用语义网概念体系优化人工智能技术
  人工智能是计算机科学的一个分支,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。“机器学习”是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,主要使用的是归纳和综合的方法,所以对于概念体系的构建需要足够重视。而机器学习技术的发展又为概念体系自动构建奠定了技术基础。
  案例2:苹果公司的Siri是一款語音控制应用,可以实现编辑短信、拨打电话、查询天气等功能,还可以与用户进行文字与语音聊天。“活跃本体”(Active Ontology)是Siri整体架构中非常关键的成分,在活动本体内对用户输入进行解析,并将文本信息在这里解析为用户真正的意图,然后根据意图来调用外部的服务。而这就是语义网研究领域的Ontology,也就是概念体系[5]。
  2015年,苹果收购英国语音技术初创公司VocalIQ,将语音处理和机器学习技术应用到可穿戴设备、家庭联网设备中,同时特别关注车载应用的开发。这次收购也可以帮助苹果Siri在未来迈入汽车领域,成为语音识别领域体验最好的产品。
  案例3:自然语言处理在自动问答系统上的应用,如微软小冰、苹果Siri、IBM Watson的QA(question answering)系统,包括分词、词性标注、句法分析以及相关工具的使用,这些都离不开概念体系的建立。
  语音识别技术最终目标是将人类发出的语音转化为计算机可理解的机器语言,实际应用时可以与现有技术结合。
  3.3 案例分析小结
  通过分析以上案例可以得出,语义网概念体系的应用领域十分广泛,给科技企业也带来不少机遇和挑战。机遇在于新型计算机技术的发展给科技企业带来了新的动力与方向,若能抓住先机将此类技术与产品进行融合,率先占有市場,就能成为语义网概念体系建设的领跑者。
  4 结语
  总之,语义网概念体系技术的应用的范围非常广泛,如语音翻译、语音识别、指纹识别等、听音识歌、图像识别、自动问答。以优化搜索引擎检索效果。语音识别与手机等移动设备的结合也是大趋势。
  目前关于语义网概念体系的建设方法、建设工具和相关标准,国内起步较晚,研究成果不多,应用成果也多为国外应用成果的模仿,所以未来需要更多国内学者与行业从业人员的创新。
  参考文献
  [1] 杜勇1李曼1王大治2.语义网与Ontology研究综述[M]-计算机应用2004(10).
  [2] Semantic Web Architecture. http://www.w3.org/2000/TaIks/1206-xm12k-tbI/sIide10-0.htmI.
  [3] GRUBER CTR. A translation approach to portable ontologies[J]. Knowledge Acquisition,1993,5(2):199-220.
  [4] Studer R, Benjamins VR, FenseI D. Knowledge Engineering, Principles and Methods. Data and Knowledge Engineering,1998,25(1-2):161-197.
  [5] Siri.https://www.baidu.com/link?url=1BHRk5eemWzYhLI1_pNqBJB_GNaktkZOClRSDOYD-ghur5tg3Q79SwPmeKHKY4frl1_0cRmS9dPatlZbDciRb_&wd=&eqid=b7e6f0bf000488260000000356d01ac9.
  作者简介
  燕夕子(1990.12~),女,江苏徐州,天津外国语大学2015级硕士,研究方向:国际信息交流与管理。
  王珊珊(1992.11~),女,河北邯郸,天津外国语大学2015级硕士 研究方向:国际信息交流与管理。
其他文献
[摘 要]水利水电工程是我国经济的重要组成成分,关系着国民的生活水平和国家的综合实力。而地基是影响水利水电工程的重要因素,地基质量的好坏是建好水利水电工程的基础。随着时代的发展,对地基的设计和处理技术的要求也越来越高,水利水电工程也在地基的带动下不断地往前发展。本文将就水利水电工程设计中地基的分类、地基处理技術地基处理的准备工作、和地基处理中应注意的问题进行分析和探讨。  [关键词]水利水电工程
期刊
[摘 要]本文回顾了布氏情报思想的核心内容,并对其在大数据时代推荐系统中的现实意义进行了分析,明确了其在大数据时代下信息、知识组织和服务过程中极强的指导意义,并在此基础上构建了大数据时代推荐系统模型,并以“今日头条”为例对模型进行了解释。  [关键词]布鲁克斯情报思想;大数据;推荐系统  中图分类号:G250.74 文献标识码:A 文章编号:1009-914X(2017)21-0206-02  1
期刊
[摘 要]物资采购是电力企业的一项基础性工作,对电力企业经济效益的提高起到了基础性的作用,因此需要加强对电力物资采购的重视,特别是要加强物资采购成本的控制,为经济效益的提高奠定坚实的基础。但是在实际的电力采购成本管理与控制中,受到传统采购观念的影响,存在着以事中和事后控制为主的现象,加大了物资采购成本管理与控制的难度。为了适应动态的市场环境,电力企业要将物资采购成本管理与控制作为工作的重点来抓,最
期刊
[摘 要]尚店油田位于滨南油区的西部,往西为林樊家油田,东南部为平方王油田,东部为滨南油田滨522块位于尚店油田尚一区,尚一区地理位置位于滨州市境内,区域构造属于济阳坳陷东营凹陷西部林樊家凸起东斜坡带,南部为尚一区中部Ng-Ed5井区,东部为尚二区。对该区油藏特征进行系统研究,认为沙三段是一个中孔、中渗、常规出砂的构造-岩性油藏。  [关键词]尚店油田,滨522块,油藏特征  中图分类号:TE12
期刊
[摘 要]机械产品制造日益向高精密方向发展。为提高制造产品的精度,操作者在机械加工中采用各种方法。其中最常用的方式是补偿技术。补偿中最常用的是刀具补偿和机床电气补偿。本文着重介绍这两种补偿技术的原因、补偿原理、采用的补偿方法以、补偿时注意的事项及在机械加工中的应用。  [关键词]刀具补偿;电气补偿;精度;制造  中图分类号:F416.44 文献标识码:A 文章编号:1009-914X(2017)2
期刊
[摘 要]针对矿井通风设计的不同时期进行分别设计,矿井基建时期的通风,矿井生产时期的通风,矿井通风设计的内容,矿井通风设计的要求,及矿井通风系统的要求。  [关键词]矿井通风设计要求  中图分类号:TD724 文献标识码:A 文章编号:1009-914X(2017)21-0231-01  矿井通风设计是整个矿井设计内容的重要组成部分,是保证安全生产的重要环节。因此,必须周密考虑,精心设计,力求实现
期刊
[摘 要]随着我国经济等方面的迅速发展,海上运输的发展速度与水平也越来越高,在我国的运输业提供了可靠的保障,而船体制造过程又是海上运输中非常非常基础的一种因素,也就是海上运输的前提,对于我国的海上运输业所起的作用是至关重要的。而船体放样又是船体制造过程中的第一道工序,其重要性是不言而喻的,因此要对船体放样实训的放样方式进行系统的分析与研究。  [关键词]船体放样实训;计算机放样;手工放样  中图分
期刊
[摘 要]化肥厂排污水含有的主要污染物为氨氮、COD,具有化学需氧量低、氨氮含量高、可生化性差等特点,处理起来难度较高。因此,进行化肥厂排污水治理时,需要基于其氨氮高含量造成的水体富营养化问题进行分析,使用专业药剂,对排污水内含有的超标污染物进行有效处理,促使其达到环保排放标准,避免造成环境污染,本文即对化肥厂排污水处理要点进行简单分析。  [关键词]化肥厂;排污水处理;药剂  中图分类号:TQ1
期刊
[摘 要]随着经济的发展,资源消耗量的增加,循环经济理念已经渗透到各个领域。基于农业经济而言,循环型的农业经济是发展现代经济的基础环节。改革传统农业经济增长方式,构建以循环经济理念为核心的循环农业经济体系,促进生态环境保护与经济发展间的相互协调、共同发展是当前农业经济实现可持续发展的主要目标。本文在此从几个不同的角度对如何大力发展循环型农业经济提出了几个重要战略措施。  [关键词]农业;循环经济;
期刊
[摘 要]本文分析了城乡规划建设的要求,阐述了城乡规划建设中存在的主要问题,并提出了有效措施,以供大家参考借鉴。  [关键词]城乡规划;规劃建设;要求;主要问题;有效措施  中图分类号:TU992 文献标识码:A 文章编号:1009-914X(2017)21-0227-01  1、城乡规划建设的要求  1.1 系统协调  由于我国地少人多,资源相对贫乏,因此,城乡发展政策必须要资源和城乡之间发展相
期刊