一种基于文本相似度的网页新闻标题自动抽取算法

来源 :湖南城市学院学报(自然科学版) | 被引量 : 0次 | 上传用户：liuking

【摘要】

：

随着互联网技术的发展,网页新闻的标题抽取已经成为了信息抽取和网络爬虫中不可避免的一个环节﹒通过分析,发现目前已有的方法存在准确率和通用性无法共存的问题﹒因此,提出了一

【作者】

：

何春辉

【机构】

：

湘潭大学数学与计算科学学院

【出处】

：

湖南城市学院学报(自然科学版)

【发表日期】

：

2019年1期

【关键词】

：

网络爬虫新闻标题抽取调和相似度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的发展,网页新闻的标题抽取已经成为了信息抽取和网络爬虫中不可避免的一个环节﹒通过分析,发现目前已有的方法存在准确率和通用性无法共存的问题﹒因此,提出了一种基于文本相似度的网页新闻标题自动抽取算法,它通过结合目录型新闻网页的外部标题来抽取详情型新闻网页的真实标题﹒试验结果表明,相对现有方法来说,新算法具有较好的通用性且平均F1值达到了97.58%﹒

其他文献

完善投资者合法权益自我保护的法律机制——兼谈我国证券法相关条文的修改建议

保护投资者合法权益 ,是证券法的立法宗旨之一 ,而投资者自我保护法律机制的建立 ,是证券立法走向成热的重要表现。我国现行证券法 ,已建立起了一套行之有效的保护投资者合法

期刊

投资者合法权益自我保护法律机制

班主任工作有效管理"五手"抓

<正>班主任工作是一项复杂的艺术性工作,是一种塑造人的心灵,雕琢人的感情与性格的活动,它是一个动态的结构系统。班主任工作千头万绪,任务艰巨,教育好每一位学生是教师应尽

期刊

班主任工作任课教师有效管理班级工作

坤草芪莲汤治疗消渴病并尿微量蛋白的临床研究

目的观察坤草芪莲汤治疗消渴病并尿微量蛋白症患者的临床疗效。方法将246例消渴病并尿微量蛋白症患者随机分为3组:坤草芪莲汤联合组给予坤草芪莲汤和马来酸依那普利片治疗,六

期刊

坤草芪莲汤消渴病尿微量蛋白肾阴阳两虚马来酸依那普利

Fe-Ga合金磁特性测试装置的设计与实验

设计了一种新型Fe-Ga合金磁特性测试装置。建立了该测试装置磁路部分三维有限元磁场分析模型,在该模型基础上通过调整结构和元件尺寸优化了磁路结构,并制作了样机。搭建了磁

期刊

磁特性弱磁场有限元法Fe-Ga合金

影响老年桡骨远端骨折小夹板治疗后早期腕关节功能的相关因素

目的:本课题通过对老年桡骨远端骨折患者小夹板治疗后早期腕关节功能进行研究,分析影响腕关节功能的相关因素,为临床医生判断预后并及时采取防治措施提供依据。方法:本研究采

学位

桡骨远端骨折小夹板治疗腕关节功能相关因素

P53、vimentin、Ki-67的表达及血清CA125变化与上皮性卵巢癌预后分析

目的此次研究运用免疫组化的方法检测标本中P53、vimentin、Ki-67的表达,并记录血清CA125变化,探讨各影响因素对上皮性卵巢癌的预后影响,为患者的诊疗及预后评估提供理论依据

学位

P53vimentinKi-67CA125上皮性卵巢癌预后

社会治理视域下群团组织参与“精准扶贫”路径探析——以C市共青团为例

自习近平于2013年在湖南湘西地区考察时首次提出了"精准扶贫"方略后,"精准扶贫"逐渐成为全面建成小康社会伟大事业的重要一环。C市作为全国共青团改革方案的试点城市,同时也

期刊

群团组织共青团社会治理社会工作精准扶贫

冠心病患者血清Vaspin、ATGL水平变化及意义

目的探讨冠心病（CHD）患者血清脂肪特异性丝氨酸蛋白酶抑制剂（Vaspin）、脂肪甘油三酯脂肪酶（ATGL）水平的变化及意义。方法选取CHD患者139例（CHD组）,健康对照者52例（对照组）。CHD患者中,

期刊

缺血性心脏病脂肪特异性丝氨酸蛋白酶抑制剂脂肪甘油三酯脂肪酶

S-Zorb技术的完善及发展

介绍了S-Zorb技术原理、工艺、特点,对现有S-Zorb工业装置开工初期出现的进料/反应产物换热器积垢、再生器内吸附剂结块、过滤器反吹阀泄漏、闭锁料斗送料管道堵塞和阀门失效

期刊

S-Zorb技术吸附剂催化裂化汽油脱硫

老寒腿冬季保健方

<正>老寒腿是膝关节骨性关节炎。人的膝关节是个活动范围很大的负重关节,几乎承受着人身的重量,膝关节由于长年的磨损,是最容易老化的。老化后的膝关节往往容易发生骨性关节

期刊

老寒腿

一种基于文本相似度的网页新闻标题自动抽取算法

其他学术论文