基于混合方法的中文微博自动摘要技术研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:EAGLE1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博内容驳杂、信息稀疏的问题,深入研究传统自动摘要技术,结合微博数据特点,在微博事件提取的基础上提出一种基于统计和理解的混合摘要方法。首先根据词频、句子位置等文本特征得到基于统计的初始摘要;然后通过语义词典,计算句子相似度、确定事件主体进行基于语义理解的可读性加工,使最终摘要更具可读性;最后采用合理的摘要评价方法评价所得摘要。实验结果表明,该方法在不同压缩比例下均能获得质量稳定且可读性良好的摘要。
其他文献
<正>~~
期刊
本文通过分析喀什噶尔河流域水资源利用现状,总结出流域水资源开发存在的主要问题和突出矛盾。为促进区域水资源利用与人类社会的协调发展,提出必须建立与区域水资源承载能力
<正>桂政发[2016]72号各市、县人民政府,自治区人民政府各组成部门、各直属机构:现将《广西各级政府部门权责清单管理办法》印发给你们,请认真贯彻执行。2016年12月21日广西
期刊
目的:探讨二甲双胍联合炔雌醇环丙孕酮在多囊卵巢综合征不孕症治疗中的应用效果。方法:选择2016年4月至2018年4月于本院就诊的86例多囊卵巢综合征不孕症患者为研究对象,根据
朱鹮鸣声信号具有非平稳性,针对FFT不能反映信号的瞬时性以及无法摆脱基函数的问题,提出了一种基于HHT变换的MFCC参数特征提取算法,通过对信号进行EMD分解,得到每一帧固有模
随着大规模片上多核处理器的发展,越来越多的核被集成到一个芯片上.一方面,总会有一些核处于空闲状态;另一方面,受功耗限制片上单核比较简单,导致单线程性能较弱.通过在片上
<正>桂政办发[2017]35号各市、县人民政府,自治区人民政府各组成部门、各直属机构:近年来,国家进一步加大对我区经济社会发展的支持力度,中央预算内投资不断增加,这对我区经
期刊
地质空间数据来源广泛、类型繁多、数量巨大,其属性信息复杂、专业性强,作为与地理位置、空间分布直接相关的数据,是地质学研究的基础。国内外有关机构早已开展了地质数据库
准序化供货是在准时制的基础上对零部件进行排序供货,其顺利实施需要依靠稳定的生产序列与零部件交付的可靠性。针对零部件交付过程中的意外事件,研究了受到意外事件影响时的
存储器是计算机系统的重要组成部分,其信息存取的正确性对整个系统至关重要。随着计算机应用的广泛和深入,人们对系统可靠性的要求越来越高,存储器错误的检测和纠正是提高存储系