基于聚类的文本分类算法框架研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:zb_jinzhen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN算法因其易于理解、理论成熟等优点而被广泛应用于文本分类。由于KNN需遍历样本空间计算距离,当训练集样本规模较大或维数较高时,计算开销是巨大的。针对此问题,首先将遗传算法适应度函数设计部分与K-medoids算法思想相融合形成K-GA-medoids,其次将其与KNN相结合形成用于文本分类的算法框架,在分类过程中,采取先聚类,再分类的步骤,以实现对训练集样本的缩减,从而降低计算开销。实验表明,K-GA-medoids相较于传统K-medoids而言在聚类效果上有较为明显的提升,且将其与KNN相结合形成
其他文献
四川省德昌县大陆槽稀土矿主要稀土矿物为氟碳铈矿,其嵌布粒度细,与其他矿物嵌布关系复杂;萤石、重晶石、锶钡硫酸盐矿物等伴生矿物含量高,矿石泥化现象严重,造成稀土矿物难
电力通信网络的快速增长,传统被动响应的事后运维模式迫切需要向分析预测的事前运维模式转型。论文在深入研究典型决策树理论的基础上,针对电力通信设备运行状态的关联特性,
谷胱甘肽转移酶(glutathione S-transfer,aGsSeT)是由多基因编码、具有多种功能的超基因家族酶,是细胞内转运的"通用"载体蛋白。哺乳动物的GST可调控细胞增殖和死亡信号通路,
制备了一系列不同NiO(0%、0.41%、0.93%)含量的V-Mo/Ti脱硝催化剂,考察了NiO含量对催化剂的影响。采用X射线荧光光谱(XRF)、X射线衍射(XRD)、N2-吸附脱附、H2-程序升温还原(H
随着深度学习方法的不断发展,基于深度卷积网络特征的语义分割已经成为自动驾驶、室内导航、遥感制图等领域视觉感知应用的一项重要技术。然而对于多样性变化背景中的目标图像,现有基于局部上下文卷积特征的语义分割方法仍然存在分类精度低的问题。为此,提出了基于可变向卷积网络的语义分割算法。首先,在特征图每一个像素点上预测对象主要观测方向,然后在这个主要的方向上通过卷积运算来预测对象的类别。考虑到对象的尺度的变化
针对深竖井施工中的岩爆问题,以弹性应变能、平均能量释放率、塑性区体积为评价指标,研究不同掘进速率、竖井掌子面实施不同应力释放孔方案及井壁有无锚喷支护情况下围岩的能
基于LED的可见光通信技术能够实现照明与无线通信的双重功能,因此被越来越多的人们所关注。但存在高PAPR、要求LED具有高线性特征及不适合发光亮度调节等问题,需要采用ACO-OF
为了探究猪德尔塔冠状病毒(PDCoV)感染仔猪肠道引起的组织病理学变化及其在肠道中复制并导致肠道出现炎症病变的作用机制,本研究使用PDCoV天津地区分离株TJ1经口服感染10日龄
尊敬的广大作者:《中国兽医科学》为学术性期刊,设有预防兽医学、基础兽医学、临床兽医学共3个栏目。主要刊登具有较高学术水平的兽医科学研究论著和相关学术论文。1约定1.1
东昆仑造山带西段矿产资源丰富,岩石种类繁多,是我国西部重要的矿产生产基地。为加深对此区域构造演化和成矿规律的认识,选取了夏日哈木—锡铁山成矿带岩石作为研究对象,通过