论文部分内容阅读
随着游戏领域的不断发展,游戏的种类和数量在不断地增长,相应的,游戏攻略数据也不断地增多。游戏攻略包含大量游戏升级信息,是玩家特别是新手玩家的主要查阅对象。目前,游戏攻略数据交杂地分布在游戏资讯网站中,玩家在查询感兴趣的游戏攻略时,需手动进行查找,花费大量的时间。为了帮助游戏玩家快速查找自己感兴趣的游戏攻略,本文提出了基于领域本体的游戏攻略文本标注算法。 本文实验语料为游戏攻略数据。本文方法共分为三步,具体而言,本文首先构建游戏领域知识库,由于每款游戏有多个资讯网站且每个网站之间存在差异,故融合时会产生冲突,如何解决产生的冲突是构建知识库的难点。然后,针对游戏术语抽取的难点和特点,本文提出了游戏领域词汇发现算法和决策树分类模型相结合的游戏术语抽取方法。最后,由于从游戏攻略中抽取的游戏术语大多以简称的形式存在,故需要将抽取到的游戏术语和游戏领域知识库进行链接,得到其全称即标签对游戏攻略标注。通过这些语义标签,不仅能直观地了解攻略的内容,也能更好地为攻略文本提供语义检索服务。实验结果表明,所提出的本体构建方法在游戏领域具有一定的推广性且本文术语抽取方法比现有的其它的方法更加有效,准确率、召回率、F1值均提高了25%左右。同时,语义标签的生成可以丰富游戏领域本体。