大规模文本数据的分类系统的设计与实现

来源 :现代计算机:下半月版 | 被引量 : 0次 | 上传用户:wenwenan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
云计算模式解决了大规模数据存储和计算能力上存在的瓶颈,为大规模数据挖掘技术提供了理想的计算模式和技术手段。分析Hadoop云计算平台的数据存储和计算模型,在云计算模式的基础上.实现云计算平台上Web文本数据的贝叶斯分类模型。对于大规模数据挖掘中的数据存储和计算的问题和难点.提出一种高效、低成本的解决方案。
其他文献
为充分发挥智能手机在运算和信息传输上的优势.基于智能手机和嵌入式数据库设计图书馆读者服务系统。系统选择.NET平台,采用SQLite数据库,实现读者认证和文献资源搜索与预定等基
目的探究妊娠期糖尿病的规范化治疗对妊娠结局的影响。方法选取该院2012年1月—2017年12月收治的妊娠期糖尿病患者200例进行研究,以随机数字表法分为对照组(n=100)和观察组(n
目的根据该院接收的肺结核合并糖尿病患者和单纯肺结核患者接受抗核治疗的效果进行研究分析。方法选取该院2012年5月—2014年5月接收的肺结核患者70例,对患者是否合并糖尿病
目的探究优质护理模式在老年糖尿病合并高血压患者中的实践效果。方法选取2017年6月—2018年5月在该院接受治疗的老年糖尿病合并高血压患者70例,采用随机数字表法将其分为对
为进一步发挥银行卡业务的功能,改善城市、农村支付结算服务质量,促进银行卡产业的快速发展,我们对吉林省白城市银行卡业务现状进行了调查。
基于iOS应用开发过程中经常需要用到用户自定义手势识别功能,但是iOS API仅仅提供了简单的手势功能,不能满足开发者要求。基于向量统计和正则表达式的自定义手势识别算法实现了复杂的用户自定义手势识别功能,并在iOS平台实现了该算法。
传统的最大功率跟踪算法,都是在光伏组件光照强度均匀的前提下提出的。但是,实际情况中光伏组件会部分被遮挡,P—V曲线产生多个峰值点,使得现有算法跟踪失败。研究部分遮挡情况下
目的:了解降钙基因相关肽(calcitonin gene-related peptide,CGRP)浓度在单侧睾丸扭转复位后对侧睾丸组织中不同时段的变化,阐明CGRP与对侧睾丸早期损伤之间的联系。方法:将30只
在研究现在国内的各地区建筑类预算软件数据接口的基础上.提出一个符合行业业务需要的标准数据定义,并提供相关数据接口和数据适配器接口定义;为了满足行业内其他软件调用建筑预
目的:观察三氧化二砷(ATO)对MRL/lpr狼疮小鼠脾脏CD4+T细胞IFN-γ基因启动子甲基化的影响。方法:免疫磁珠法分选16~18周MRL/lpr狼疮小鼠和C57BL/6J正常对照小鼠脾脏CD4+T细胞,PHA-p(2