一种基于决策树的新闻内容抽取方法

来源 :合肥工业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:Eryuelan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章提出了一种针对中文新闻网站的新闻内容抽取方法,该方法使用特征向量抽取和决策树学习算法来建立新闻网页节点分类模型,并把模型根据不同的网站进行分类,构建一个模型库。当输入一个新闻网页url时,先通过url判断是哪个新闻网站,再从模型库中选择相应的节点分类模型,如果没有对应的模型就使用通用的节点分类模型对其进行抽取,实验证明这种方法可以达到很好的效果。
其他文献
由于高度的计算复杂性,柔性调度是NPhard问题,采用数学规划方法很难求得最优解。智能优化算法(如遗传算法)求解此类问题的近优解的有效性和实用性已被证实。在用GA算法求解此类调
针对美国2013年《新一代科学教育标准》和中国2017年《普通高中物理课程标准》,以高中电磁学内容为例,从核心素养的4个维度对比了两国课程标准内容编排上的相同性与差异性,进
文章以由绿粉制作的3种型号(20-0704N、25-1217FN(B)和40-1004NA)VFD作为实验样品,按照产品检验规范条件,实测每个样品的阳极电流和亮度,应用威布尔分布函数描述其发光效率分布,
这是属于中国人的感动时刻,这是属于河南人的荣耀时刻。2017年2月8日,南阳已故平民英雄王锋成功当选2016“感动中国”年度人物。至此,河南人连续四年荣登“感动中国”的领奖台。
1月16日,中国记协国内部邀请部分老新闻工作者座谈,李普、缪海稜、左漠野、戴邦、殷参、邢方群、张沛、纪希晨、钟沛璋、江涛等出席会议. 会上座谈了今后如何加强老新闻工作
微信投票大行其道,对其评价却是分裂的。通过分析一个微信投票样本,从投票网页的形式与内容、投票过程与票数、投票群体的发起与组成、微信投票的利弊与实质等四个方面,进行"
分别用前驱体分解法与剥层重堆法制备出二硫化钼纳米球(nano-MoS2)与聚甲醛/二硫化钼夹层化合物(MoS2-IC),再利用制备的nano-MoS2、MoS2-IC与微米二硫化钼(micro-MoS2)作为原料制备
自主提问对学生的学习有着重要作用。在小学英语课堂教学中,老师应认识到自主提问能力的培养对学生的重要意义,正确对待学生的自主提问,培养学生的问题意识以及提问的方式和
在我十二岁的时候,我就想到了死亡,想到作为人是件很悲哀的事情。从呱呱坠地的那一刻就已经注定了死的结局,如同去做一件事从最初就已看到了最坏的结果。为此,我有一种幻灭感
文章通过对采购计划问题的研究和应用现状的分析,提出了面向全球供应链的集成采购计划概念;概述了该主题的研究背景与动机,给出了采购计划问题的基本模型及其研究进展;回顾了