基于直播文本的足球比赛新闻自动生成方法研究

来源 :武汉科技大学 | 被引量 : 2次 | 上传用户:maxin_smart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着体育直播平台的发展,足球比赛直播室出现了大量足球直播文本;同时,移动端阅读的兴起,使足球比赛新闻的需求量也大幅提高。直播文本是对比赛的实时过程加以口语化的描述,冗长且重点模糊;而足球比赛新闻则是对足球比赛中事实的概括性报导,一般简短而且着重于重点事件。人工撰写足球比赛新闻会花费较多时间并影响新闻的实时性。一般来说,足球直播文本中包含了这场比赛中的绝大部分信息,而本文的研究重点就是基于直播文本中的重要信息生成足球比赛新闻。文本将足球比赛新闻生成看作文本摘要任务,而传统文本摘要方法在足球领域会出现重要信息丢失、可读性低等问题。为解决这些问题,本文将足球比赛新闻生成细分为三个部分:(1)基于球员、球队数据与句子模板生成足球比赛新闻的概述和结尾;(2)采用分类模型,从人工标注的直播文本抽取句子;(3)基于抽取句和序列到序列模型的复述句生成。本文提出了基于直播文本与注意力编解码模型的足球比赛新闻生成方法,该方法首先基于极限梯度提升树、卷积神经网络等分类模型与文本特征从比赛直播文本中抽取句子;随后使用基于注意力模型与双向长短时记忆网络的编解码模型对抽取句做复述句生成;最后结合句子模板与复述句,在尽可能召回重要事件的前提下,提升文章的可阅读性。本文抽取并选择适合足球领域的文本特征,将多种机器学习模型与足球比赛新闻生成任务相结合,使用基于规则的句子模板来提升最终生成的足球比赛新闻质量。实验结果表明,采用本文提出的方法从足球比赛的直播文本生成足球比赛新闻是可行的。
其他文献
在我国宪法及运行体制框架下,行政规范性文件附带审查一直是公法研究领域的热门话题,随着社会发展日新月异,新生事物层出不穷,行政机关所面对的社会行政事务也更为复杂多变,为了应对行政管理的需要,各地各级行政机关也相继出台了各种各样的行政规范性文件,但实践中,行政规范性文件也逐渐暴露出了诸多问题,如规范内容与上位法规定不一致、超越制定权限等等,这些问题的出现不仅不能够使得法律法规及国家政策很好地贯彻落实,
女朋友想把照片制作成电子相册,笔者找了好多电子相册制作软件,效果都不理想。最后终于找到了一款适合她使用的工具——ilife知羽自动系统3.0(以下简称“知羽”)。它是一款Flash电子像册制作软件,可利用现成的模板来制作像册,只需简单的几步就可以制作出品质超凡的像册。特别适合女朋友这类菜鸟级用户使用。
分析建陶企业质量成本的构成,探讨建陶企业质量成本的控制方法,论述质量成本控制在建陶产品成本控制中的意义.
安装催化净化器是目前控制机动车污染排放量有效的技术手段之一,而用于车排放污染的治理,将会遇到很多具体的技术问题,文章从理论与技术两方面来分析如何确保在用车加装催化净化
从电驴或BT上下载回来的APe或Flac高品质歌曲都附带有相应的Cue索引文件,但在用Foobar2000或者其他播放器播放时,读取扩展名为.APE或.FLAC的文件则无法分段播放,而读取Cue索引文件
陕西省委机关刊物《共产党人》于6月25日召开了纪念创刊15周年座谈会。这是一本有较高质量的刊物,在全国有一定影响。本刊刊登这组文章,对兄弟刊物表示祝贺,并希望《共产党人
本文简单介绍了利用浙江本地原料研制一次烧成釉面砖坯体配方的经验;试制出成本低廉的坯体配方.
对分类收集于城市生活的有机垃圾作为沼气发酵原料的相关参数与特性进行了研究。结果显示:来自对固定区域的城市生活有机垃圾,其总体TS(总固体)、VS(近发性固体)、COD含量相对较为
浊点萃取(CPE)是一种新兴的液-液、液-固萃取方法,通过对该方法的相分离行为,改变实验参数如表面活性剂疏水性,平衡温度及时间、离心时间、pH值、离子强度、萃取物与表面活性剂浓度、添加