基于语义Web技术的非结构化文档管理方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xiomantou_3737
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,伴随着数据库技术、数据挖掘技术、数据仓库技术等的成熟和广泛应用,结构化文档管理问题已经基本得到解决;信息技术的广泛应用带来非结构化文档激增,但对其应用效率低下,而新兴管理思想的涌现以及全球化竞争的日益加剧迫切要求对组织中的非结构化文档资源进行有效的管理。非结构化文档管理正日益成为互联网时代信息资源管理的一个关键问题。本文将语义Web技术及标准引入非结构化文档的分析、标记和应用过程,以形成一套有效的非结构化文档管理方法,满足企业应用的迫切需求。本文首先系统介绍了语义Web的相关理论,其中重点是语义Web的三大关键技术:XML、RDF及本体。之后围绕非结构化文档管理生命周期的全过程:获取、标记、组织/存储及应用,分析了每个环节目前还存在的问题。之后引入语义Web技术进行分析和解决,重点解决了:1)文档标记中涉及到的标记语言(外表特征和内容特征两方面)、标记过程及标记工具,并最终形成完整的结构化的标记描述,以利于计算机进行理解和自动处理;2)组织方法采用基于本体的组织方法代替传统线性组织方法,以满足分布式的网络信息组织的需要,同时存储方式采取监督机制来协同源文档和标记文档之间的同步关系,以确保两者同时更改和删除;3)最后具体的应用则从信息检索、自动分类、智能推理三个方向来分析:信息检索时利用本体进行查询扩展,并根据语义相似度进行检索排序;自动分类则以领域本体作为分类树,以形成动态统一的分类标准;智能推理方面则利用本体和描述逻辑来实现计算机理解的、规范化的描述,并利用描述逻辑的推理功能进行智能推理。最后,在完成前面分析和解决问题的基础上,形成了完整的非结构化文档管理框架,详细描述非结构化文档管理生命周期的全过程,并设计了一个企业邮件管理原型系统,以验证研究的可行性和正确性。
其他文献
在学习生活中,有些学生的学习成绩优异不是因为他们的智商高于常人或天赋异禀,而是因为他们有良好的学习习惯.可以说一个好的学习习惯对于我们不仅在学习上有帮助,在工作以及
一、引言rn鲁迅,原名周树人,浙江绍兴人,生于1881年,逝于1936年,中国近代伟大的文学家、思想家和革命家,鲁迅在杂文、短篇小说、诗歌、评论、散文、翻译等不同的文学作品领域
期刊
在当今产品日益多样化及交付期日益缩短的市场需求环境下,企业必须对市场做出快速响应,并提供多样化、个性化的产品,然而,这在较低柔性的流水线生产下是无法实现的。为了能够全面
在知识经济时代,高新技术产业以其高附加值、低污染、市场潜力大等优点,成为世界上各个国家竞相发展的产业。一个国家高新技术产业的发展水平和发展规模甚至决定着该国当前以及
以EuCl3和NdCl3混合水溶液为研究对象,按正交浓度序列以浓度为外部扰动构建紫外可见-荧光二维相关光谱.在混合溶液的二维相关光谱中,观察到了Eu3+的荧光发射谱峰与Nd3+的吸收
随着信息化的发展,企业资源计划(ERP)已成为越来越多企业信息化建设不可缺少的一部分。然而,ERP项目是一个由多阶段、多活动组成并涉及多个合作方参与的复杂信息化工程,实施特点
SNM理论是基于演化经济学和技术系统论基础上建立的有关技术生态位和技术演化的分析方法,通过从微观到宏观进路的经验描述,初步建立了技术演化模型。本研究通过分析典型的数
随着人们环保意识的增强以及相关法律的日趋完善,越来越多的制造型企业注重废旧产品的回收并进行再制造。再制造不仅能够减少原材料的使用、减少污染而且能够保护环境并能增加
近年来随着电子商务的发展,对仓储空间的要求越来越高,而仓储系统中最重要的问题就是提高仓库利用率和产品的出入库效率,提高仓库利用率和产品出入库效率成为众多企业和研究者关