维基百科下协同式语义摘要获取的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：dvcsvf

【摘要】

：

运用语义万维网（Semantic Web）需要对传统的网络资源进行一些具有一定语义的标注。目前建立用于标注的本体（Ontology）是比较困难的。为了降低技术难度可以用一些具有结构化信息的

【作者】

：

汪洋

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2008年期

【关键词】

：

语义万维网维基百科语义标注语义摘要获取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

运用语义万维网（Semantic Web）需要对传统的网络资源进行一些具有一定语义的标注。目前建立用于标注的本体（Ontology）是比较困难的。为了降低技术难度可以用一些具有结构化信息的资源作为数据来源。维基百科（Wikipedia）就具有一些优良的标注性质，它是一个对各个领域都有描述的协同编辑的大型知识库。例如：文章的内容是对某个特定的实体进行描述；文章的分类已经具有一定分类学意义；文章之间通过超链接具有很强的联系；文章内容组织具有结构性，如，表格信息和段落标题等等。如果我们把这些标记看作是具有一定语义的对于文章的摘要，那么我们就可以从这些摘要中得到一些构成本体（ontology）的元素，例如类（class），个体（instance），关系（relation）等等。但是语义摘要的获取完全靠人工的方式编辑有很多潜在的问题。例如：标注存在不确定性，标记的缺失，标记的噪声，标记过于多样等等。本文利用已有的标注信息，通过他们之间的联系，自增强地获得一个明确的联系，例如：某个分类具有特定的表格，段落标题。具有相同表格和段落的文章属于同一类。这就得到了这些浮出的语义摘要。例如当用户编辑了一个分类下的文章，我们就可以提示他编辑相应的表格和段落。当用户编辑一些表格和段落信息后，我们又可以提示他用相应的类对文章进行标注。这样我们就可以在用户编辑新文章或者对现有文章进行改进时提供帮助，例如，对缺失的信息进行补全，对噪声进行过滤，对标注多样性的文章规范。作为将来的应用，我们可以利用已经生成的语义标记，可以很好地有指导地从维基百科学习一个更加形式化更加规范的本体。本文将介绍相关的工作和现状，在维基百科下运用自动协同式的方法获取语义摘要，并通过实验加以验证，对相关的领域的贡献以及潜在的应用也将做出简要的分析。

其他文献

基于群体智能的ABC支持型QoS路由机制的研究与仿真实现

随着互联网的规模不断地增大,新兴的技术伴随着新网络需求的提出不断地发展,出现了计算机、电视、电信以及卫星等诸多有线和无线网络迅速地融合的现象,下一代互联网NGI (Next

学位

下一代互联网路由总最佳连接服务质量群体智能

H.264视频编码器的多任务调度与数据布局优化

H.264是新一代的视频压缩标准,压缩效率高,但算法复杂度大。ADSP-BF561处理器是Blackfin系列中的一款高性能DSP产品,价格较低,处理能力较强。目前,在ADSP-BF561上实现的H.264

学位

视频编码器多任务调度数据处理布局优化压缩标准

反垃圾邮件技术的研究及其在校园网中的应用

随着互联网的发展和应用的普及，电子邮件已经成为人们日常工作和生活中不可缺少的一种方便快捷的通信手段。但是近些年来，互联网上的垃圾邮件问题日益严重，垃圾邮件的形式和内容

学位

反垃圾邮件校园网RBL技术反向DNS查询病毒扫描贝叶斯方法

基于图模型能量最小化的图像分割方法

图像分割在是图像处理技术中的关键步骤,人们接触到的图像是由像素组成的复杂变化的系统,该系统所得的最优分割对于计算机来说是不可知的,很难用明确的数学模型得到最优解。

学位

图像分割图模型马尔科夫随机场能量最小化图割水平集

基于单样本的人脸识别研究

随着社会的不断发展,人脸检测和识别技术得到广泛的关注。人脸识别技术在生物识别中占有重要的地位,经过三十多年的发展,已经取得了长足的进步。目前大多人脸识别系统可以在

学位

局部二值模式人脸检测人脸识别主成分分析

基于异构多处理器的网络视频服务器的组件模式研究与实现

随着视频处理在嵌入式应用中的不断增长,嵌入式视频系统的复杂度不断提高,系统规模逐步扩大,视频产品的推出时间也在不停地缩短,这使得嵌入式视频系统的设计开发面临着系统日

学位

网络视频服务器组件模式异构多处理器功能测试

分层式入侵检测技术在入侵防御中的应用与研究

随着网络带宽容量迅速增加,网络设施日益更新,入侵方式也层出不穷。蠕虫等网络入侵攻击不仅对个人计算机、服务器的正常运行造成破坏,甚至会对路由、交换等网络基础设备的正

学位

网络安全自防御网络入侵检测异常检测自动网络重配置TCP会话劫持

网格环境下基于移动代理的实时监控研究

网格将整个互联网整合成一台超级计算机,实现各种资源的全面共享,可求解资源消耗大、计算复杂度高、在传统技术下无法有效解决的问题。网格系统需要监控各组件的运行状态以及

学位

计算机网络实时监控移动代理优化设计

特殊环境高速总线技术的研究与实现

苛刻环境通信系统蕴藏着巨大的潜在应用价值，抗电磁干扰机制与算法是众多应用的核心支撑技术。为了提高系统在恶劣环境中的通信能力，本研究拟通过冗余和低电压差分方法为抗电磁

学位

苛刻级别总线FPGALVDSDS编码

位置服务中的隐私保护技术研究

位置服务作为移动互联网时代的基础服务,在人们的日常生活中扮演着越来越重要的角色,据统计将近80%的应用与位置服务有关。位置服务中移动用户需要与位置服务提供商共享其位

学位

位置服务隐私保护位置k-匿名增量近邻查询评估模型

维基百科下协同式语义摘要获取的研究

与本文相关的学术论文