基于语义空间聚类和主题匹配的新闻多文档文本摘要生成方法

来源 :第五届全国信息获取与处理学术会议 | 被引量 : 0次 | 上传用户:zzy101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多文档文本摘要技术是将同一主题事件的文档汇总、集合,将其中多次重复的相关信息以简洁的方式一次表达在文摘中,解决冗余信息给人们造成困扰的问题.针对网络上大量同一主题事件的新闻网页,根据新闻体裁的特殊结构和内容特点,本文提出一种有效的生成新闻多文档文本摘要的方法.该方法根据语义空间得到词汇相似度,通过聚类方法将同一个事件中的主要主题信息和子主题信息区分出来,并利用主题匹配方法挑选出各主题的代表句,形成候选摘要,尤其讨论了新增文档带来的新增主题实际在线情况,生成的多文档文本摘要不仅能够准确的突出主要信息,并能覆盖其他子主题,动态发现新增信息,使用户全面了解事件的发展过程及变化。
其他文献
槲皮素在体外具有很多生物活性和药理作用,但是由于溶解度较差导致口服吸收生物利用度很低,极大地限制了在临床上的应用.本研究分别采用溶剂挥发法制备槲皮素固体分散体和槲
介绍了世界风力发电控制系统的发展历程和我国的研究现状.分析并得出风力发电系统中,控制系统是确保机组安全可靠运行、优化机组效率的关键.详细介绍了控制系统的功能,并给出了
会议
由直接作用抗病毒药物来地帕韦(NSSA蛋白抑制剂)和索他洛尔(NSSB聚合酶抑制剂)组成的复方片剂是第一个被批准用于临床的丙肝抗病毒治疗复方制剂.来地帕韦和索他洛尔的主要代
由P-糖蛋白引起的多药耐药是肿瘤治疗失败的主要原因之一.本研究制备了以DSPE-PEG2000和TPGS1000为脂材、以叶酸为主动靶向配体的负载多西他赛的胶束,用于克服肿瘤多药耐药并
通过对油站运行特点、运行要求的分析,结合了汇管调压式、单台调压式控制流程的实例,讨论并提出了比较合理的控制方式,为今后油田自动化技术的应用、改造、推广及生产自动化程度
电容层析成像技术具有非侵入、响应快及易于安装等特点.图像的重建算法与技术是电容成像在工业实际中得以应用的关键.近年来在图像重建方面的研究取得了较大的进展,Tikhonov正
今年2月8日是俄罗斯天才的化学家门捷列夫(1834—1907)诞生125周年纪念。特选此译文刊出以为纪念。 February 8 this year is the 125th anniversary of the birth of the R
经分析,美国OMEGA等公司的产品样本分析,认为仪表企业有"大而全"、"小而特"两种模式,就目前我国的实业情况提出了"小而特"是国内温度仪表企业发展方向的观点.
研究洋甘菊MatricariachamomillaL.的化学成分.采用硅胶、凝胶、制备液相等色谱方法进行分离纯化,并利用核磁(NMR)、质谱(MS)等现代波谱技术对化合物的结构进行鉴定.从维药洋
虚拟样机技术是利用计算机分析软件,通过建立运动学、动力学模型来分析和评估系统的性能,从而为物理样机的设计和制造提供参数依据.本文简述了虚拟样机技术和动力学仿真软件ADA