基于主题词权重和句子特征的自动文摘

来源 :华南理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:opss_eagle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%.
其他文献
将理论分析和数值模拟相结合,研究了轴压一弯曲联合荷载作用下功能梯度材料圆柱壳的屈曲行为.以经典Donnell壳体理论为基础,得到功能梯度材料圆柱壳的屈曲控制方程,并通过本征值
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
自驾车旅游作为一种新的旅游形式,近年来在我国的发展速度十分迅猛,市场潜力庞大。但游客在进行旅游产品购买决策过程中的非理性化导致其行为表现也更加随性化、个性化、复杂化,这就给游客管理和市场的有序发展增大了难度。本文通过引入涉入理论来研究非理性决策模式下的自驾车游客行为特征,识别游客需求,并提出相关发展建议,对于进一步开展市场营销有一定程度的促进作用,也吸引更多的群体关注中国自驾游。从这些方面来说,本
目前,我国老龄化形势越来越严峻,大多数年轻子女外出工作,剩下老人留守家中,随着老年人口的庞大,以及科技的发展,他们对物质生活和精神生活的要求也逐渐提高,传统养老产品较
每当走在大街上、超市里,看到那刚出炉、热气腾腾、香气四溢的爆米花时,我总会停下脚步狠狠地吸上几口气,有时也爽快地买上一桶,不顾形象在大街上抓着边走边吃。朋友调侃我像
从城市路网交通管理与控制的需求出发,引入交通流宏观基本图(MFD)模型,基于实测和仿真数据,开展对北京市西三环实际路网的宏观交通状态、时变特征以及影响因素研究.文中首先