云计算平台上两种中文分词算法的实现对比研究

来源 :电脑知识与技术:学术版 | 被引量 : 0次 | 上传用户:h459403474
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,常用的中文分词算法为IKAnalyzer(简称为:IK)和ICTCLAS(简称为:IC)两种,这两种算法也可以说是如今的主流中文分词算法,为了能够更好的研究两种算法的性能,本文首先利用理论对两种算法在单机环境下的性能进行分析,而后通过Hadoop分布式文件管理系统(简称为:HDFS)、Hadoop集群和并行处理大数据集的MapReduce所共同组成的系统框架,并将算法优化后,通过开展大量的实践性实验对两种不同算法在分布式环境下对大数据集进行处理后的表现进行比较,而后得出具体的分析结果,希望能够为相
其他文献
在自然学科领域中,实验教学所占比重较大。若教师采用单纯讲解方式告知学生物理实验原理、步骤及结果,只强调理论层面而不通过动手实验展开教学,学生的学习状态将处于被动层
<正> 胡公寿(1833-1886),名远,字公寿,号瘦鹤,以字行,又号横云山民,华亭(今上海松江)人,侨居上海卖画为生。能诗书,善画花卉和山水,尤喜画梅。书法宗颜真卿。书法秀雅,以湿笔
期刊
结合国家重点学科优势,依据国家级教学团队标准,从多个方面具体介绍了建设优秀病理学教学团队的做法以及所取得的成绩。
目的:探讨超氧化物岐化酶(SOD),微量元素锌(Zn)、铜(Cu)、铁(Fe)水平与白癜风病人发病进程的相关关系。方法:正常人及白癜风病人血SOD活性测定采用邻苯三酚自氧化法。血清Zn、Cu、Fe含量
提出了《组织学与胚胎学》网络教学平台设计中应遵循的原则、使用技术及其总体结构,同时对网络教学模式的效果进行了统计。
针对本科毕业生动手能力差、知识面窄等问题,结合该校制药工程专业开展了跨专业实习,提出了具体的措施,并从专业确定、教学计划调整、教学形式改革、课题选择、团队组成以及管理
随着我国汽车的使用率日益增高,车位供不应求。为了避免因车乱停在别人车位的矛盾,提高车位利用率,很多车位都会安装车位锁。但市面上的车位锁漏洞较多,例如:没有报警系统、
针对某种电流传感器的带宽和响应时间,提出了对应的测试方案,并设计了一种在要求范围内可调占空比和频率的信号发生器。通过信号发生器对被测信号的频率进行调制,获得对应的F
本文以Nylon66颗粒为溶质,甲酸为溶剂,成功制备了Nylon66纳米纤维,并对其制备过程中的影响因素进行了分析和探讨。通过扫描电镜对制得的纤维进行观察发现:以甲酸为溶剂,当纺
针对通用技术课程教学现状,引入虚拟现实技术,并构建了一个专门用于该课程汽车驾驶与保养模块的虚拟现实平台。该平台为教学改革提供了一种新的思路,有助于解决经济欠发达地区因