基于领域本体的游戏攻略文本标注算法研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:lixuelei19890117
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着游戏领域的不断发展,游戏的种类和数量在不断地增长,相应的,游戏攻略数据也不断地增多。游戏攻略包含大量游戏升级信息,是玩家特别是新手玩家的主要查阅对象。目前,游戏攻略数据交杂地分布在游戏资讯网站中,玩家在查询感兴趣的游戏攻略时,需手动进行查找,花费大量的时间。为了帮助游戏玩家快速查找自己感兴趣的游戏攻略,本文提出了基于领域本体的游戏攻略文本标注算法。  本文实验语料为游戏攻略数据。本文方法共分为三步,具体而言,本文首先构建游戏领域知识库,由于每款游戏有多个资讯网站且每个网站之间存在差异,故融合时会产生冲突,如何解决产生的冲突是构建知识库的难点。然后,针对游戏术语抽取的难点和特点,本文提出了游戏领域词汇发现算法和决策树分类模型相结合的游戏术语抽取方法。最后,由于从游戏攻略中抽取的游戏术语大多以简称的形式存在,故需要将抽取到的游戏术语和游戏领域知识库进行链接,得到其全称即标签对游戏攻略标注。通过这些语义标签,不仅能直观地了解攻略的内容,也能更好地为攻略文本提供语义检索服务。实验结果表明,所提出的本体构建方法在游戏领域具有一定的推广性且本文术语抽取方法比现有的其它的方法更加有效,准确率、召回率、F1值均提高了25%左右。同时,语义标签的生成可以丰富游戏领域本体。
其他文献
协议是计算机网络的命脉,协议复杂性的提高导致协议工程学科的出现。协议工程的主要活动包括协议描述、验证、性能分析、自动实现和一致性测试,其中协议描述和分析是整个协议工
本文由项目开发中有关嵌入式Linux的移植工作,引出了关于研究与探索嵌入式Linux实时性问题的讨论。 本文首先介绍了嵌入式系统及其发展现状,阐述了项目设想和项目意义。接着
网络技术的发展为远程教育提供了一片崭新的天地,现代远程教学系统是一种以网络为基础的远程教育,它继承了传统远程教育方式中不受时间、空间和地点限制优点,学习者可以足不出产
近年来,数据挖掘领域出现了很多有关时间数据的研究,时间序列分析是其中非常重要的一部分.这些数据可以很容易的从科学研究和金融领域得到.例如:每日气温、产品输出、基金和
随着通信技术和计算机技术的发展,各种新兴的网络服务不断涌现,对于服务管理的需求变得越来越强烈。通过服务的管理有利于提高运营商的网络管理水平和保证客户服务质量。关于
本文主要讨论了为满足嵌入式领域的需要,使Linux系统支持硬实时性的研究与实现。文章首先对嵌入式系统、嵌入式Linux操作系统和实时操作系统进行了简要的介绍,并对Linux作为嵌
学位
今天,人们寻找WWW上的信息,通常是在搜索引擎上执行一个查询。很多搜索引擎是基于关键词的,对于每一个查询,他们返回一个与查询内容匹配的Web网页的序列。对于宽话题查询,这样的搜
本文首先介绍了Agent定义及结构,多Agent系统的组织结构、协调模型理论和UML对象设计。概述了敏捷供需链管理系统(ASCMS)和多Agent技术在ASCMS中的应用。在这些理论基础上,针对
机器人直线轨迹特性是工业机器人的一项重要指标,其中的轨迹重复性和稳定性综合反映了机器人的机电性能和控制运动轨迹能力,成为工业机器人最重要的一个出厂检测指标。但长期以