海量中文短信文本最佳聚类数研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:lucky121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对海量中文短信文本的聚类簇数的确定问题,提出一种基于聚类过程的短信文本最佳聚类数确定方法。通过扫描一遍数据即可获得多个统计信息,利用增量逐层划分得到最优划分所对应的簇类数,求出最优解。实验结果表明,与其他方法相比,该方法的分类效率较高。
其他文献
新的《英语课程标准》要求在英语教学为学生的终身学习和无限发展打好基础。本文认为:学生具有巨大的英语学习天赋,只要教师坚信学生英语学习的潜力,克服学生学习英语的“焦虑”
随着我国证券市场和证券投资基金的快速发展,对于基金业绩的评价成为近年来基金研究的重要课题,而基金业绩的持续性是评价基金业绩重要的方面。基金业绩持续性是指前期业绩优
“一个地球一个联合国一杯中国茶”,自5月1日上海世博会联合国馆揭开神秘面纱,浓浓的安溪茶文化氛围就吸引无数参观者。在联合国馆内的“中国世博十大名茶”品茗区看到,前来品饮
资产份额定价法是寿险定价法的主要方法之一,由于资产份额定价法与保险人的预期利润目标相关联而得到保险人的青睐,广泛应用于寿险领域,近年来随着学者的深入研究其应用已经
简要统计了2014年5—6月国内发生的各种环境事件155起,包括沙尘天气13起,污染事件16起,地震43起,山体滑坡和泥石流27起,旱灾4起以及其他自然灾害52起。
针对符号执行分析方法路径资源消耗过大的问题,提出执行路径建模进程化的过程内分析优化方法。结合基于惰性初始化的对象建模方法,以Phoenix编译器中间表示层的代码作为直接
11月6-9日,2006全国茶艺职业技能大赛总决赛在杭州隆重举行。大赛由劳动保障部中国就业培训技术指导中心、中国茶叶学会等单位联合主办。
为实现各种形式的XML数据查询,介绍一种双路索引方法,采用倒排序技术建立绝对索引模型和相对索引模型,并提出相关查询处理的算法。绝对索引模型将查询路径表达式缩短,减少比
随着科技的进步,人们生活水平不断提高,消费水平持续上升,名优早茶备受消费者青睐。发展名优早茶生产既能给经营者带来高效益,义能满足市场需求。为促进茶树早生快发,使名优茶提早