一种符号型增量数据标签算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户：herojian

【摘要】

：

数据标签是一种提高增量数据聚类效率的简单而有效的方法。数据标签就是分配每个新增数据点到与之最相似的簇的过程。符号数据分析的难点之一在于缺少一种恰当的方法来定义数

【作者】

：

李艳红李德玉王素格

【机构】

：

山西大学计算机与信息技术学院,计算智能与中文信息处理教育部重点实验室

【出处】

：

计算机科学

【发表日期】

：

2015年06期

【关键词】

：

聚类数据标签增量数据符号数据信息熵

【基金项目】

：

国家自然科学基金(61272095,61175067,61303091,61202365,61100138,61403238);山西省自然科学基金(2012061015);山西省科技攻关项目(20110321027-02);山西省回国留学人员科研项目(2013-014)资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据标签是一种提高增量数据聚类效率的简单而有效的方法。数据标签就是分配每个新增数据点到与之最相似的簇的过程。符号数据分析的难点之一在于缺少一种恰当的方法来定义数据点与数据簇之间的相似性。为此,将簇代表定义为簇中所有属性的属性值及其在簇中的频率构成的列表,用信息熵的变化来定义"点-簇"不相似性。基于此不相似性度量,设计了一个符号型增量数据标签算法来分配无标记数据到恰当的簇。在公开数据集和文本语料上的对比实验表明,该数据标签算法不但数据标记精度高、时间开销小,而且有较好的可伸缩性。

其他文献

基于RCM的数控机床维修管理研究

以数控机床为例,通过对RCM实施以及设备的可靠性分析的阐述,按RCM思想对设备的可靠性和故障后果,经过逻辑决断和有效性分析,确定设备的维修工作和工作周期,制订出相应的维修

期刊

可靠性RCM数控机床维修管理

真实及虚拟社区的网购人际影响关系网络结构特征研究

真实社区及虚拟社区是消费者发布、传播、获取口碑信息的重要渠道,社区成员之间通过口碑信息交流产生购物人际影响关系,本文选取约200个真实社区和400个虚拟社区,以社区内约

期刊

社会网络分析真实社区虚拟社区口碑营销网络结构

基于VAR模型的中国创业板羊群效应研究

羊群效应一直是我国主板市场研究的热点问题,受到开板时间的制约,关于创业板市场羊群效应研究相对较少.以创业板为研究对象,基于CCK模型检验方法,引入成交量指标,分别从价、

期刊

创业板羊群效应VAR模型成交量

平稳随机序列通过线性时不变系统的预测问题

本文讨论了平稳随机序列通过线性时不变系统后的纯预测问题。用Hilbert空间投影算子理论研究在最小均方误差准则下的线性预测器,给出了最佳预测器的参数计算公式。分析了最佳

期刊

预测器二阶矩最小均方误差参数计算投影算子线性时不变系统平稳随机序列测度函数

心理社会因素对产后抑郁的影响

<正>产后抑郁是一种较为严重的产后妇女身心疾病,不仅影响产妇的健康,危及婴儿,而且影响到婚姻家庭和社会的和谐。有研究表明,产后抑郁与生物学、心理社会因素及产科等诸因素

期刊

产后抑郁爱丁堡产后抑郁量表产妇年龄婆媳关系心理社会因素

《草地上的午餐》:一次“印象式”的绘画革命

马奈是公认的印象画派的开山鼻祖,他的创作对印象画派的形成起了极其重要的作用。《草地上的午餐》作为马奈的代表作之一,堪称一次"印象式"的绘画革命。本文就《草地上的午餐

期刊

马奈草地上的午餐印象画派裸体形象

推进中国-东盟信息港南宁核心基地建设打造中国-东盟数字经济基地

<正>近年来,南宁五象新区按照中央实施国家大数据战略加快建设数字中国的决策部署,以中国-东盟信息港建设总体规划以及自治区、南宁市推进中国-东盟信息港南宁核心基地建设相

期刊

中国-东盟信息港数字经济

基于Bayes网的软件失效预测模型

<正> 1 引言随着航空电子设备向着综合化和数字化方向发展,计算机已成为现代航空电子系统的核心。机载计算机的用量迅速增长,软件的复杂性变得越来越高。20世纪60年代改型的F

期刊

Software failureBayesian networkMarkov Bayesian network

用起来!不让电子白板成摆设

随着现代科技的发展，交互式电子白板已经进入很多幼儿园的教室，成为教师教学、幼儿学习的好帮手，也成为新幼儿园设施配备中必不可少的教育装备。结合交互式电子白板的使用，在教学

报纸

《平均数》课堂教学实录及评析

期刊

平均数生活中取值范围统计图用水量《平均数》教学实录

一种符号型增量数据标签算法

与本文相关的学术论文