深度学习与SVM相融合的新闻分类技术研究

来源 :华北理工大学 | 被引量 : 4次 | 上传用户:yinmeng6112501
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息处理技术和网络传输技术的急速发展,进入了信息爆炸的空前时代,人们急切的想通过互联网获得世界各地的最新新闻资讯,但每个人关注新闻的时间有限,无法快速的从杂乱的新闻消息中获得自己想看,关心的内容。新闻分类是一项对新闻进行分门别类的技术,能够按照新闻内容的领域、涵盖范围、种类等划分方式,将新产生的新闻进行自动化归类。用户可根据新闻类目快速找到自己所需要的资讯内容。新闻分类属于一种监督性的机器学习技术,算法需要根据已经标注好正确类别的新闻内容进行模型训练,再用模型对未知类别的新闻进行自动化分类。文章根据新闻类目标注需求设计了一个新闻标注系统,采用众筹的思想,让各个类别领域的人员参与新闻类别标注,为了保证标注质量,设计了一套标注规范及标注效果验证方法。根据新闻内容特点,文章对传统文本分类算法进行研究,综合分析算法原理及应用范围,选择了适合新闻分类的SVM算法。以SVM算法为基础,设计了一个基于SVM的新闻自动分类架构,并对架构中每个模块的设计思想进行了详细的介绍。针对SVM分类算法特点,对算法模型指标进行改进,将算法计算需要的特征进行关键特征选择操作,不断对特征抽取进行迭代运算,选取对分类贡献最大的一些特征,提升了模型运算速度。然后针对新闻中图片占比越来越大而文本占比越来越少的现状和趋势,在SVM分类中融合深度学习方法,利用卷积神经网络技术提取新闻中中图片的深层次特征,与文本的浅层特征一起参与到分类模型的训练,分类指标得到了一定的提高。
其他文献
生物炭基肥是一种以生物炭为载体与传统肥料掺混制成的新型缓释肥料,在农作物生产、土壤改良和污染治理等领域得到广泛应用。通常采用团聚、挤压、熔融、喷雾、流化等方法制备生物炭基肥。课题组前期开发了一款新型生物炭基肥成型机,相较于传统成型机,该成型机集输送、挤压、成型、切粒于一体,工作稳定可靠,所制备的炭基肥颗粒强度高,基本满足肥料相关国家标准,具有较高适用性。但我们通过试验发现该成型设备温升明显,容易造
社会资本对大学生就业起着重要的作用.大学生要在短时间内找到满意的工作,他们必须依靠一定量的社会资本.例如社会、学校、家庭等都可能影响到这一资本的获得.因此,大学生在
目的研究脑源性神经营养因子(BDNF)对急性脊髓损伤大鼠核转录因子-κB(nuclector.kappaB,NF.KB)表达的变化。方法参照Nystrom压迫方法制作大鼠脊髓压迫损伤模型,成年健康Wistar大鼠72
目的:肾间质纤维化是慢性肾脏病发展到终末期肾病的共同途径和主要病理基础,目前的治疗措施在一定程度上具有抗肾纤维化的药理作用,但总体治疗效果并不十分理想,无法阻止其进
近年来,苯硼酸基(PBA)葡萄糖敏感材料在糖尿病治疗领域备受关注。PBA功能化纳米胶束因方便的制备方法和优异的葡萄糖敏感性能而广泛应用于药物控制释放系统。本文主要综述了近
目的重症急性胰腺炎(severe acute pancreatitis,SAP)并发症多,死亡率高.寻找SAP死亡相关因素,是减低SAP死亡率的关键.方法 1986年10月至1999年5月间我院共收治的42例重症急
目的探究口服盐酸曲唑酮辅助治疗脑卒中后抑郁(PSD)的疗效。方法选取2016年10月至2018年12月于该院接受治疗的92例PSD患者为受试对象,按照随机数字表法分为研究组与对照组,每
介绍基于GIS的配电网规划系统,分析了基于GIS技术的配电网规划建设方法,结合实例,针对GIS在配电规划建设中的应用进行探讨与研究,希望能够为我国电力系统的建设与发展提供借
针对传统狼群算法(WPA)存在易陷入局部最优解、计算资源耗费大、鲁棒性低等问题,提出一种基于差分进化的改进狼群算法(DWPA)。首先,通过引入探狼搜索因子、猛狼最大奔袭次数、自适
这条正在表演并购狂舞的“眼镜蛇”会不会像无数死于过度扩张的公司一样,最后心力衰竭而亡?