基于分布式技术的语义感知的实现的研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:david_jts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,因特网难以置信的飞速发展,使得web成为一个巨大、分布广泛、全球性的信息中心。在这个分布式信息空间中蕴涵着具有巨大潜在价值的知识,如何从海量信息中快速有效的获得有用的信息,并及时过滤垃圾信息成为一个非常重要的研究课题。   本课题基于分布式的语义感知技术是根据以上需求提出来的,它包括如下两方面的含义:第一,数据对象是分布在网络上的海量的动态的无结构或半结构数据。特定的数据存储特点决定了该项技术是基于分布式的;第二,仅对关键词的把握是不够的,我们需要感知和过滤垃圾信息,本文中的感知区别于人类认知的抽象能力,而是利用语义感知来逼近人类的类比认知。感知能力主要体现在对获取到的网络数据的针对性和准确性。其中感知的针对性体现在对特定信息屏蔽,准确性体现在从语义的角度来研究和解决问题。这个过程是通过提取信息来构建本体进行推理,从而感应网络上数据的变化、自动获取网络上感兴趣的信息、最后将这些信息智能转化为可供人类直接决策参考之用的知识。   分布式技术目前已经在现代信息网络中得到广泛的应用,并且在大型应用系统中有很强的适用性。本文将传统的分布式技术和基于本体的语义感知相结合,提出一种在分布式框架下的语义感知模型,并且在该模型的基础上,通过一个简单的分布式的过滤系统来对本框架做了具体的实现。在实现的过程中把过滤信息分为两种,一种是色情、反动、暴力等垃圾信息,在文中描述为敏感信息;另一种是正常信息。对分布式节点服务器中含有的敏感信息,主站点的服务器根据语义感知,能对其做监控,并且控制其操作,能够通过开发的软件对其过滤。本文通过对比上下文感知和基于本体的语义感知,最终选择基于本体的语义感知作为本文的研究方向,由于本体是语义网的主要研究方向,在语义分析方面具有不可替代的优势,为研究语义感知提供了一定的研究基础。   本文主要通过信息抽取,构建本体,语义标引,语义推理等几个方面来实现语义感知。首先在介绍本体论的相关概念和本体在信息提取领域的相关工作。其次,本文通过设计分布式体系结构,主要针对分布式并行处理的理念、分布式的索引机制、数据同步容错、汇总排序及分页实现等方面的描述,对分布式系统做了详细的描述。在分布式基础之上设计语义感知模型,主要实现分布式感知的三个模块信息抽取模块、语义标引模块和推理感知模块。最后本文描述了一个具有基于语义过滤和内容监控功能的分布式构架的设计和实现。分布式信息过滤系统具有监控节点服务器、节点服务器网页信息抽取、应用层上关键字过滤和语义过滤、基于URL、关键字的访问控制、根据本体对文本信息过滤等功能,系统运行稳定,达到了预期效果。
其他文献
云计算作为一种新的IT资源组织、管理和交付模式,将物理的软、硬件资源逻辑化、动态调度和分配,并以服务的形式按需提供给最终用户,具有灵活、自动、高效、经济、节能的特点,受到
随着Internet的快速发展与普及,网络化软件正逐步成为未来软件发展的趋势之一。“软件服务”作为一种新的软件实体,承担着封装各种资源、完成计算并对外提供服务的任务,被认
多跳无线网络(Multi-hop wireless networks),如移动自组网(Mobile Ad hoc network, MANET),无线传感器网络(Wireless Sensor Network, WSN),无线Mesh网络(wireless mesh net
伴随着计算机综合能力的日益强大和互联网的迅猛发展,自然语言处理已经成为信息处理领域一个引人注目的研究热点。词性标注是自然语言处理的重要内容,也是自然语言处理工作的
文物保护一直是各个国家的工作重点之一,文化遗产的发扬与传承关乎整个民族的存在和发展。在中国数千年的文化中,对古文字或图案的研究是重中之重,甲骨文、碑文、鼎文等形态各异
21世纪以来,随着信息技术的不断革新和通信技术的飞速发展,人类社会已经步入了真正的信息时代。尤其是互联网的迅速发展,给人们带来了丰富的资源和极大的便利,同时也潜伏着各
随着互联网的普及和发展,电子商务逐渐融入到人们的日常生活中,人们可以足不出户的买到自己想要的产品。但是电子商务网站上存在大量的商品信息,客户在纷繁的商品中寻找有用
在互联网蓬勃发展的今天,互联网上的信息更是浩如烟海。人们在享受互联网带来的便利的同时,却面临着一个如何在如此海量的内容中准确、快捷地找到自己所需要的信息的问题,由
近年来随着计算机技术的进步,图形处理方法的提高,加之新的拍摄技术的出现使得影视动画制作成本提高的同时,其商业回报也越来越高。对于美国魔幻史诗《指环王》三部曲,观众不仅为
随着油田的发展以及工业自动化水平的提高,利用现代计算机设备、通信网络技术对设备进行数据的远距离采集和监控的方式得到了广泛运用。在油田及其他工业领域经常通过有线的