基于Storm云平台的增量文本分类机制研究

来源 :内蒙古工业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:chchone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是目前众多大数据应用的核心问题.本文将Batch SVM增量算法与Bagging算法相结合,提出了一种增量文本分类算法.在云计算分布式处理框架Storm基础上整合所提出的算法,构建了一套高效的基于Storm云平台的在线增量文本分类机制,在真实数据集上构建的实验验证了所提机制的准确性和效率,在保证准确度达到90%的前提下,所提机制的处理时延较现有算法降低50%以上,可以有效实现在线文本分类问题.
其他文献
档案管理是学校重要的管理工作之一,是提高学校教学质量和学校管理水平的重要保证。而会计档案管理又是档案管理工作的重要组成部分,因此,加强会计档案管理对学校的发展有着重要
随着五常市稻米经济的不断发展,农业机械化、水利电气化将不断更新完善,如何确保机电井、抽水站、水利发电站等水利电力工程的安全高效运行,为农业安全生产提供保障是关键环
基于当前桥梁建设施工现状,将桥梁施工裂缝进行分类并分析其裂缝成因,从而具有针对性的研究桥梁工程施工中的裂缝防止策略,以提高施工效率和施工质量,推动施工工作的稳定进行
孤立形式是脱离语境的语音形式,是静态的,与动态的连续话语中的语音尚有一定距离。英语语音教学的重心应从孤立形式转移到连续话语。连续话语语音教学的两个主要方面为语流音变
鹰爪虾(Trachysalambria curvirostris)为我国近海虾类中重要的经济种,对其种群动力学的研究具有重要意义。本文应用R中TropFishR包的ELEFAN、LCCC和Beverton-Holt模型等方法
目的 :探讨进行综合护理干预对提高脑卒中后抑郁患者治疗依从性及生活质量的意义。方法 :对2012年2月~2014年1月期间我院收治的96例脑卒中后抑郁患者的临床资料进行回顾性研究
2018年12月22日,“梦回长安——百万校友回归”陕西师范大学专场签约仪式在西安举行,会上,陕西三八妇乐科技集团与陕西师范大学正式签署战略合作协议。陕西三八妇乐科技集团
新媒体环境下成长起来的当代中国青年人,其媒介素养与文化认同有些驳杂,有必要到具体的文化现实中寻求答案。在多元的媒体文化环境下,青年群体对官方主流文化既积极拥护也存
随着我国经济和科技的日益发展,与国际接轨的机会越来越多,随着网络世界的日益兴盛,旅游业的发展也日益发达起来,因此诞生了一系列旅游管理人才。旅游管理专业作为应用型专业