一种新的演化文本流聚类算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:LXL66798
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流的聚类作为聚类的一个分支,已经成为了数据挖掘的研究热点。虽然已经有不少数据流算法出现,但是大部分都是针对低维的数值型数据,很少有高维文本流的研究。本文在传统的数据流聚类框架基础上,提出了一种新的文本微聚类结构体,它更适合文本聚类,同时还将在线微聚类分为潜在微聚类和异常微聚类,提高了对孤立点的适应能力。实验表明该算法相对于其他文本流聚类算法更有效。
其他文献
形式化描述和可视化描述是目前主要的两类软件体系结构描述方法,形式化描述以体系结构描述语言ADL为代表,可视化描述以统一建模语言UML为代表。目前软件体系结构描述领域的热
针对现有扫描检测算法对隐蔽扫描、慢扫描无法识别的不足,提出了基于协议状态有限机的检测算法,该算法能更准确地检测出普通扫描,对隐蔽扫描、慢扫描等现有技术难以检测的扫描也
将描述端业务的LESS脚本转换为着色Petri网模型,可以为实现形式化方法检测端业务间的冲突提供基础。本文根据业务逻辑树节点的特性和LESS的定义,提出了通用的转化规则,实现了端
应用MD-20显微图象分析仪对30例结直肠癌的P53蛋白免疫组织化学反应产物进行定量测定,以观察P53蛋白相对含量与肿瘤生物学行为的关系.结果显示:结直肠癌P53蛋白MOD值与PCNA增
从团队学习视角,探讨高管团队跨界行为对企业创新绩效的影响作用。通过78个企业高管团队样本的问卷调查、数据分析和假设检验表明,高管团队的跨界行为对团队学习及企业创新绩
在企业社会责任背景下,以员工效用最大化为目标,分析了NGO参与CSR建设对企业人力资源影响的机理和原理。企业参与CSR建设有助于构建企业的人力资源竞争优势,从而提高企业的竞
识别低效部门是企业组织剥离战略的首要任务。在建立一般企业部门的模型并定义其效率的基础上,构建了由部门、企业主体和市场组成的分析系统,由此,根据效率准则导出部门的剥
通过操纵产品稀缺性影响产品售价、促进产品销售已经成为众多厂商行之有效的营销策略,并得到了大量理论与实证研究的有效支持。研究发现,产品稀缺(供应性产品稀缺VS.需求性产品稀
私募基金管理者与基金外部投资人之间的关系本质上是一种委托代理合约关系。从基金管理者存在代理问题的角度出发,研究一个连续时间委托代理模型。在该模型中,基金管理者必须尽
模型转换在MDA软件开发方法中扮演着非常重要的角色,尤其是从CIM到PIM的转换。本文给出了一种从CIM转换到PIM的方法。在CIM中,我们通过特征模型来组织需求,同时用软件体系结