今日头条推出国内首个写稿机器人

来源 :齐鲁周刊 | 被引量 : 0次 | 上传用户:somlist
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本刊讯 一个叫「Xiaomingbot」的AI机器人,最近忙坏了。
  里约奥运会期间,AI机器人「Xiaomingbot」通过对接奥组委的数据库信息,实时撰写新闻稿件,以跟电视直播几乎同时的速度发布稿件。据了解,Xiaomingbot主要报道乒乓球、网球、羽毛球和女足的比赛,在16天内共发布奥运新闻456篇简讯和资讯。
  Xiaomingbot是今日头条实验室研发的AI机器人,可以通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。
  Xiaomingbot到底是什么来头?
  Xiaomingbot,是今日头条实验室的研发成果,其「写稿」模块是由头条实验室与北京大学计算所(万小军团队)联合研发而成。
  李磊博士正在跟团队的小伙伴改良机器人算法。
  这是国内第一款可以报道奥运赛事的人工智能机器人,在结合了最新的自然语言处理、机器学习和视觉图像处理的技术之后,通过语法合成与排序学习生成新闻。头条实验室负责人李磊博士介绍道,Xiaomingbot通过连接数据库实时更新比赛信息,搜集相关选手背景信息,根据比赛规则判断比赛进程,进而生成文本,自动配选图片,最后润色完成报道。机器人可根据比赛的总比分、每节比分情况以及比赛的不同项目、不同状态,生成不同的短讯和长文比赛详情描述。
  相比国内第一代写稿机器人——腾讯的 「Dreamwriter」和第一财经的「DT稿王」,Xiaomingbot的写稿技术已经进入第二代写稿水平。与第一代机器人相比 ,Xiaomingbot特征显著:
  1. 速度快 数据库数据更新的2秒之内,即可生成新闻稿并完成发布。2秒的时间包含了从生成、提交到头条号「奥运AI小记者Xiaomingbot」发布、通过头条的推荐算法机制分发推荐给用户的整个过程。
  2. 样式多 既可以生成长的详细比赛描述总结,也可以生成简明扼要的快讯简报,以前的自动体育新闻只能生成较短的文章。
  3. 自适应 根据比赛选手的排名,赛前预测与实际赛果的差异,比分悬殊程度,可以自动调整生成新闻的语气,并使用感情色彩的词语,如实力不俗、笑到了最后等。
  4. 自动配图 以前的自动新闻都只能生成文本,通过自动选图技术,Xiaomingbot可以給新闻配图,更加生动形象。
  能做到这些,头条实验室给Xiaomingbot的写稿模块使用了3种核心技术:一种是通过概率文法生成文章,也就是说这个机器人生成的句子会有完整语法结构,有主语、谓语、宾语、时间、人物、地点等要素,同时不拘泥于一种形式来描述比赛,会有变化;另一种是通过排序学习算法决定一场比赛新闻描述中需要选择什么样的句子,重要的句子才会在新闻里出现;还有一种是在技术上不算特别难,却非常重要的比赛逻辑判断,可根据每种项目不同的比赛规则来判断比赛的激烈程度和比赛进程如是否结束、是否中间退出比赛等。
  据了解,目前在做奥运报道的机器人只有两家——《华盛顿邮报》的「Heliograf」和今日头条的头条实验室「Xiaomingbot」。
  Xiaomingbot并非想取代记者。相反,新闻机器人是记者的助手,可以帮助记者更高效的完成新闻报道工作。头条实验室负责人李磊博士说道。
  Xiaomingbot最大的意义在于,面对奥运会这样同时举行上百场比赛的综合赛事,记者很难关注到每一场比赛,而机器人可以任劳任怨的为每一场比赛报道,无论这场比赛多么冷门和不重要。传统新闻理论并不认为这些冷门比赛或者热门比赛(比如乒乓球)的前几轮小组赛有新闻价值,可是通过我们的平台测试,我们发现对冷门场次的报道仍然有可观的阅读量,这个阅读量非常长尾,而新闻机器人可以弥补对这种长尾的新闻需求。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
展览时间:2016年11月12日至2017年2月12日展览地点:日本东京银座索尼公司源于日本,是世界最早的便携式数码产品开创者,如今已是全球知名的大型综合跨国企业,在视听设备、电子
量子点是近年发展起来的一种新型荧光探针,与传统的有机荧光染料相比,具有许多优良的光谱性能,在生物化学、细胞生物学、分子生物学等研究领域显示了极其广阔的应用前景,已经引起了人们越来越广泛的重视。本论文瞄准这一重要的研究方向,在对当前迅速发展的量子点进行简要综述的基础上,以量子点的制备、量子点的性能表征以及量子点在化学生物分析中的应用为主线,主要开展了以下几个方面的工作:一、直接制备了水溶性CdTe量
随着社会的不断发展,新媒体改变了人们的日常生活,网络、手机的大量普及与应用,使人们在足不出户就可以接触到大量的信息,不断挑战着纸质媒体的主流地位。高校校报作为校园的
巫鸿先生对中国美术史的贡献不仅在于独特的研究视角,敏捷的思维方式,更在于对于细节的高度重视。如何将“整体阅读”、“原境”这样的概念运用到霍墓石刻的研究中,需要我们
样品的制备与前处理是色谱分析过程中至关重要的一步,样品前处理方法的选择直接影响到分析方法的可靠性、准确性。本文研究了加速溶剂萃取在提取复杂样品中弱电离化合物的应用
氧电极,无论是用于氧气析出(OER)还是氧气还原(ORR),是电解水、燃料电池和金属氢化物-空气二次电池研究领域的关键问题之一。目前氧电极相对差的催化能力是制约氧电极高效应用的关键因素。本论文以甲醇、乙醇和异丙醇为添加剂,采用电沉积的方法在Ti基底上制备了Co基催化电极,并将其应用于碱性及中性介质中的氧析出反应。采用XRD、SEM、IR分析技术对催化剂的晶体结构、表面形貌及组成进行了表征,并利用方
北京时间2月16日消息,有人担忧如果人工智能发展过于迅速,机器人会崛起并从人类手中接管地球,但另一方面,有些人可能会觉得与机器人结婚也是不错的选择。据英国《每日邮报》
本论文通过对缝焊机器人工作站的设计,结合实际进行机器人选型、缝焊机头的设计及安全防护需求分析,将工业机器人、焊接控制器、夹具、安全门及周边设备连接起来,实现相互通
为了提升哥斯达黎加木薯的发展,哥斯达黎加农业技术研究所将于2012年10月4-5日举办第4届“根茎作物面临挑战”国际木薯会议。在国际研讨会上,哥伦比亚国际热带农业中心Fernan