基于SKOS的学术文本多粒度语义标注方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:luojing0825
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的知识组织系统不能提供可被计算机理解的语义信息,从而限制了互联网上知识的组织、协作和共享。随后Tim Bemers-Lee提出了 Semantic Web(语义网),使信息的处理方法从单纯的语法处理转变为复杂的语义处理,伴随语义网的发展,语义标注的重要性也随之凸显。目前基于本体的语义标注方法已经取得了显著的研究成果,但在实际应用中将所有的概念在本体中体现需要耗费大量的精力,同时还必须调动领域专家的力量,这使得基于本体的语义标注方法的应用出现了阻碍,W3C发布的简单知识组织系统SKOS资源描述框架为解决这一问题提供了途径。此外,目前的标注方法都仅能实现单一粒度的知识组织方式,但用户的信息需求常常呈现多粒度,单一粒度的信息组织方式难以满足用户的个性化信息需求。本研究为解决以上问题,提出了基于SKOS的学术文本多粒度语义标注方法并进行了实证研究。首先,本文梳理总结了语义标注与SKOS相关理论基础,其中语义标注的粒度组织问题,基于本体的语义标注方法的过程、技术、工具问题,以及叙词表的SKOS描述问题都是本文研究的重要理论基础与技术基础。其次,本文在相关研究成果的基础上分析并回答了基于SKOS的学术文本多粒度语义标注方法的实现的四个关键问题:标注粒度层次构建问题、标注语言的选择问题、标注方向问题和多层次标注结果的表示问题,之后提出了相应的方法框架,并分别对该框架中叙词表向SKOS的转换、学术文本的多粒度处理、多粒度标注及结果描述三个主部分进行了阐述。接着,本文继续对提出的基于SKOS的学术文本多粒度语义标注方法框架进行了详细的过程分析设计,该过程主要包括学术文本资源的粒度构建,学术文本的多粒度分词,多粒度标注词选取的计算以及多粒度标注结果的SKOS描述。最后,本文选取合适的学术文本资源,以当前学术检索系统中的标注结果为参照组,使用本文提出的基于SKOS的学术文本多粒度语义标注方法进行实证研究,对标注结果进行评估以验证该方法的标注效果。
其他文献
碳量子点(Carbon Dots,CDs)是近年来十分热门的新型纳米材料,其具有独特的发光性质、良好的水溶解性、低毒性、光稳定性、良好的生物相容性等优点。现有碳量子点制备方法需要
第一部分T2*mapping对腮腺放射损伤的早期评估目的:腮腺放射性损伤是鼻咽癌患者放疗后常见并发症,常引起患者口干、吞咽困难、龋齿,甚至睡眠障碍,严重降低患者生活质量。本研
禾谷镰刀菌(Fusarium graminearum Schwabe)是一组能产生脱氧雪腐镰刀菌烯醇(deoxynivalenol,DON)毒素的真菌复合体,是造成世界范围内赤霉病害流行的主要菌种,导致小麦产量的
海流以一定流速流经立管时会产生旋涡脱落,使立管发生涡激振动,尤其在与来流垂直的横向,旋涡脱落诱发的立管周期性振幅较大;当旋涡脱落频率与立管自振频率相近,振动迫使旋涡
在我国传统出版体制下,出版社一直处于强势地位,一本书能否出版不是由作者或读者决定,而是由出版社决定。出版社的权力过分集中导致了普通作者出书难的问题,尤其很多没有背景
可控自由基聚合(CRP)是高分子化学最具科学价值和工业应用前景的研究方向,其中两亲性嵌段聚合物的制备是研究热点之一。本论文基于苯乙烯/马来酸酐(St/MAH)共聚体系的特殊性,采用氧杂蒽-9-硫酮(XT)调控St/MAH的自稳定沉淀聚合,考察调控效果并合成含有XT端基的聚(苯乙烯-alt-马来酸酐)(PSM-XT);进一步将其作为大分子引发剂引发甲基丙烯酸甲酯(MMA)聚合,制备PSM-b-PMM
坐落于今湖北省武汉市新洲区的问津书院得名于孔子适楚“使子路问津”的典故。据笔者考察,新洲是否为“问津”一事的发生地因史料不足征而难下定论,但是无可辩驳的是书院命名
随着科学技术的进步,各学科领域的信息资源不断增加,而传统的学术交流受限于冗长的出版周期和不断上涨的期刊价格,很难完全满足学者对于学术交流的需求。正是为了解决传统学
在国内汽车轮胎制造和使用行业中,橡胶制品的轮胎模具易产生污染。常规清洗多采用机械和干冰清洗技术,这类技术不仅效率低、成本高、而且环保性能差,无法满足现代化工艺需求
张量,因其高的载息量而成为复杂数据的一种有效表述方式.它在信号和图像处理、机器学习、神经科学等领域有着广泛的应用.从海量数据的张量表示中进行特征提取是张量低秩逼近