云框架下的文本挖掘算法并行化研究

来源 :设备管理与维修 | 被引量 : 0次 | 上传用户:zsjbusiniao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
很多基于Map Reduce的文本挖掘算法并行化,可以处理大规模的文本,但是算法实现困难,并行化效率低。新一代的大数据处理框架Spark应运而生,主要目的是为了提高挖掘效率,保证文本挖掘的有效性。文本挖掘的核心是文本聚类/分类算法,而传统的文本算法无法处理大规模文本。研究大规模数据并行处理技术和文本聚类/分类技术,提出基于Spark的文本挖掘并行算法,不仅可以有效的保障数据挖掘精度,还大大提升了挖掘效率。
其他文献
鲁增桥,东台市三仓镇农机站站长兼党支部书记,这位43岁的中年汉子,在市场经济的大潮中,显露他足够的胆识和勇气。短短几年,农机站从一无所有,白手起家,到拥有固定资产105万元
编辑部:我是年近60岁的教师.前年开始怠慢性鼻寞炎、肥厚性鼻爽、慢性咽炎.去年9月曾对病灶作了等离子冷凝消融术.但咽部疾病未见好转,分泌物多.每天吐多’次.总觉有痰附在咽部,令人
为了明确河北省花生/黑麦一年两作条件下黑麦的适宜播期,采用大田试验与室内分析相结合的方法,研究了黑麦不同播期对花生/黑麦一年两作中黑麦产草量、蛋白产量、地上部分养分
现今新闻最流行的做法,莫过于图解新闻。图解新闻作为一种区别于图片新闻、图表新闻、视觉新闻的新闻报道手段,在时政新闻枯燥无味、乏人问津时,它图文并茂,引人入胜;在社会
时政新闻是各级电视台新闻节目中的重点,但不同程度存在画面不规范和画面单调、枯燥等情况,本文重点介绍了时政会议新闻和领导调研活动的一些拍摄技巧。
新闻策划是新闻发展的需要,有利于新闻价值的充分挖掘,有利于新闻工作者综合素质的提高。好的新闻报道策划,会产生积极的传播效果,满足受众的新闻需求,因此,精品新闻需要精心
(1)皂荚猪肚。用猪肚1只约200克,纳入皂夹5克.煮食。或用乳鸽1只(250克),去肠杂,纳入皂荚5克干鸽腹内,同煮食。
在多年的英语教学中.我收获着学生的进步所带来的喜悦和从心底里升腾的一种职业的成就感.但同时也面对着英语学习中落后生所带来的压力.而将落后生的英语成绩提高其实是英语教学
目的探讨清开灵(QKL)注射液对大鼠实验性缺血/再灌注(I/R)损伤的保护作用及机制。方法 Wistar大鼠40只,随机分为假手术组、模型组、清开灵注射液高剂量组(QKL 40 mg/kg)、清开灵注
期刊