基于篇章级事件表示的文本相关度计算方法

来源 :中国科学:信息科学 | 被引量 : 1次 | 上传用户:dengsanhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息的剧增,信息流服务备受用户关注.在信息流服务中,如何衡量文本之间的相关度进而从多来源的信息渠道中过滤掉冗余信息提升推荐满意度成为至关重要的环节.当前主流的文本相关度计算方法均是将文本表示为向量,进而通过衡量向量之间的相似度来度量文本间的相关度.然而,信息流中的文本多为新闻文本,这些文本的核心是其描述的事件,基于此需要从事件的角度挖掘文本的核心特征进而利用其计算文本间的相关度.当前针对事件的研究大多数着眼于句子级别.事实上,在计算文本相关度时,需要从篇章级别把握文章的内容.故此,篇章级的事
其他文献
检查单位或场所7.6万多个,提出意见建议1.1万余条,运用第一种形态处理、批评教育帮助2200余人……生命重于泰山,疫情就是命令。江西各级纪检监察机关坚守职责定位,充分发挥监督保障执行和促进完善作用,以优良作风保障监督提质增效,以监督工作实际成效为打赢疫情防控阻击战提供坚强纪法保障。聚焦疫情防控的重点工作和重点环节强化监督检查"接收了多少款物?""有没有建立台账?""将捐赠款物发放到定点医院的流程
期刊
答:监督、执纪、问责。主要包括:(一)维护党章和其他党内法规,经常对党员进行遵守纪律的教育,作出关于维护党纪的决定;(二)检查党组织和党员贯彻执行党的路线、方针、政策和决议的情况,对党组织和党员领导干部履行职责、行使权力进行监督;(三)协
期刊
答:定期检查、通报党员参加组织生活的情况,向上级党组织报告党员领导干部参加双重组织生活的情况;督促开好党员领导干部民主生活会,加强对本单位内设机构和直属单位党员领导干部民主生活会的指导;机关基层党组织专职副书记列席本单位党员领导干部民主生活会和党委(党组)以及本单位负责人召开的有关会议;了解并掌握机关党员以及领导干部的思想、作风和工作情况,及时向上级党组织和本单位党委(党组)反映;了解党员、干部落
期刊
可信计算以硬件安全机制为基础,建立可信赖计算环境,从体系结构上全面增强系统和网络信任,是当前学术界和产业界的关注热点.随着信息技术的深入发展,新应用场景的不断涌现,网络空间的安全威胁日益严峻,因此可信计算在重要信息系统的安全防护领域将发挥越来越重要的作用.本文从创新发展角度,围绕作者20年来在可信计算领域的研究成果,综述了可信计算理论的发展历程,提炼总结出涵盖两大方法基础、三大信任核心和四大关键技
期刊
在过去的十几年间, Android系统由于其开源性、丰富的硬件选择性以及拥有百万级别应用市场等优点,已经迅速成为了目前最流行的移动操作系统.与此同时, Android系统的开源性也使其成为了恶意软件的主要攻击目标.恶意软件的快速增长给移动智能手机用户带来了巨大的危害,包括资费消耗、隐私窃取以及远程控制等.因此,深入研究移动应用的安全问题对智能手机生态圈的健全发展具有重要意义.本文首先介绍了恶意软件
期刊
数据类型和分布的复杂化导致样本间关系的不确定性增强,给有效挖掘数据的潜在类簇结构带来挑战.为降低样本关系不确定性对数据聚类带来的影响,本文将聚类集成中样本稳定性概念扩展至聚类分析中.本文从理论上分析样本稳定的合理性,并提出基于信息熵的样本稳定性度量方法.此外,本文提出一个基于样本稳定性的聚类方法,该方法先将数据分为稳定样本集和不稳定样本集,然后挖掘稳定样本的团簇结构,并将不稳定样本划分至该团簇结构
期刊
1经历简介冯登国, 1965年出生, 1995年于西安电子科技大学获通信与信息系统专业博士学位,博士学位论文获首届全国优秀博士学位论文,同年进入中国科学技术大学研究生院(北京)博士后流动站工作, 1997年入选中国科学院"百人计划",2019年当选中国科学院院士. 2000至2012年担任信息安全国家重点实验室主任、国家计算机网络入侵防范中心主任.现为中国科学院软件研究所研究员、博士生导师,及密码
期刊
推荐系统旨在为用户推荐个性化的在线商品或信息,其广泛应用于众多Web场景之中,来处理海量信息数据所导致的信息过载问题,以此提升用户体验.鉴于推荐系统强大的实用性,自20世纪90年代中期以来,研究者针对其方法与应用两方面,进行了大量广泛的研究.近年来,很多工作发现知识图谱中所蕴含的丰富信息可以有效地解决推荐系统中存在的一系列关键问题,例如数据稀疏、冷启动、推荐多样性等.因此,本文针对基于知识图谱的推
期刊
随着大数据对全球生产、流通、分配、消费等国计民生领域产生重要影响,事理作为认知智能重要概念,不仅帮助人们发现大数据所蕴含的国计民生的线索与发展规律,而且帮助人们更好认知人机物三元世界未来发展趋势.考虑到人机物事理动态演化是工业大数据有别于其他行业大数据处理的本质区别,本文从人机物事理动态演化特性智能认知着手,结合传统知识图谱在互联网领域取得的成功经验,提出了面向大数据领域的事理认知图谱构建与推断分
期刊
一个准确丰富的人物关系图谱不仅能够为大众提供人物实体的清晰介绍和人物之间的相互关联,而且能够为智能服务系统提供有效的知识支持.目前大多知识来源均以百科类表格数据为起点,在此基础上构建知识图谱.本文主要描述如何充分利用百科类文本数据构建高质量的人物关系图谱.为解决表格数据中存在属性缺失和错误的问题,我们采用模式匹配和深度学习模型相结合的策略从文本数据中自动学习属性值,进行属性补全和纠错,有效提高了知
期刊