基于关键词抽取的网络博客自动文摘算法的研究

来源 :成都信息工程大学学报 | 被引量 : 0次 | 上传用户:landgale527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
TextRank算法基于图论,考虑文本的整体结构,而关键词与文本主题紧密关联。网络博客作为一种新兴的出版方式,与新闻、专业论文等文本不同,其编辑方式更为随意,没有传统意义上的一般格式。将关键词抽取与TextRank算法结合起来,提出一种适用于博客文本的基于关键词抽取的自动文摘算法。首先通过TextRank算法抽取文本关键词,用BM25算法计算句子相似度。然后,以句子相似度为权重构建带权图,迭代计算获取TextRank评分。将TextRank评分与关键词评分相加得到句子最终得分,选择评分最高的前i个句子,按
其他文献
1“如果你遇见一个人,他开始让你相信缘分真实存在,那你一定要保护好自己的心,以免你的心会连滚带爬跑到他的心里去.”这是清溪遇见韩杨半年以后的微博置顶.他们的相遇说起来
大概每个叛逆的少年心中都有一个摇滚梦.十几岁时,我也曾梦想着有一天能背上吉他独自远行.虽然这个梦想最终没有实现,但我渐渐养成了收藏与音乐相关的物品的习惯.在别人看来,
“疏影横斜水清浅,暗香浮动月黄昏.”绝世的一笔白描,也像对一个人内在气质与外向姿态的隐喻——于你而言,“清浅”是你的姿态,“暗香”是你的气质.外表清冷淡然的你,内心其
高等教育评估作为国家及其教育行政部门对高等教育进行宏观管理和调控的重要手段,对高等教育质量的保证和提高有着非常重要的作用,受到了各国的广泛重视。我国的高等教育评估体
伴随着近几年的“看病难”、“看病贵”问题以及“因病致贫”、“因病返贫”等社会现象的频发,党和政府加大了对医疗救助的重视。但是,作为解决贫病恶性循环问题,实施反贫困战略
通过对家具用集成材加工工艺的研究,确定了最佳工艺参数.对样品的测试结果表明,其含水率和浸渍剥离率2项主要指标均符合相关标准的要求.因其使用了环保型无毒胶粘剂,使集成材
采用传统固相法制备了(Na0.5Bi0.5)0.6(Bi1-ySry)04TiO3压电陶瓷(记为NBBST-y),利用复阻抗谱分析了电性能,探究了陶瓷中微观组成与电性能的关联.对于NBBST-y压电陶瓷,其晶粒
中国近年来工业化建设加快了雾霾的生成,雾霾大大影响着人们的健康、生活和出行。当前最为严重的就是环境污染中的大气颗粒物排放的增加,加剧了雾霾天气的形成。因此颗粒物浓度的高低是评判空气质量好坏的一项重要指标。为获取更精准的空气质量参数,对空气中颗粒浓度进行实时监测是十分必要的。为此,设计了一款基于激光散射和显微放大的颗粒浓度检测装置,该装置以Mie散射作为理论基础,光源是半导体激光器,光照射颗粒产生的
2017年8月27-31日中国东北地区出现了一次大范围降温过程,部分地区出现降水,其中漠河县、阿尔山市在28日均出现了初雪.为研究此次雨雪降温天气的形成原因,采用常规气象观测资
以P2P网贷利率作为研究中国互联网金融市场的切入点,在分析中国P2P网贷利率与传统金融市场利率之间波动溢出机理的基础上,通过构建自相关VAR模型和多变量动态条件DCC-GARCH模