样本聚类相关论文
在自然语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要的任务......
模糊c均值算法是一种局部搜索迭代法,易陷入局部最小解,而且算法未考虑样本对聚类的贡献程度。针对传统的模糊c均值(FCM)算法的不......
为了更好地保留数据之间的同质性,提出了一种整合鲁棒结构化非负矩阵分解(integrated robust structured non-negative matrix fac......
最近,双字典训练已成为在计算机视觉和图像领域解决超分辨率复原问题的有力工具。针对基于双字典训练的图像超分辨率算法中字典训......
提出了一种基于聚类和密度的KNN分类器训练样本约减方法。使用KNN分类器进行文本分类的时侯,由于训练样本在类别内分布的不均匀,会......
对大规模汉语文本语料库分词正确率的评价提出了新的见解,即在分层抽样基础上对文本样本进行聚类.通过聚类可提高检验精度或减少样......
在现代分子生物学中,包含生物生命活动大量信息的测序数据越来越多地被应用于疾病的识别和诊断。然而,此类数据导致的“维度灾难”......
针对SCSR(sparse coding sparse representation)算法采用通用的过完备字典无法表征多种结构类型的图像以及全局稀疏重构引入过多冗......
随着DNA芯片技术的广泛应用,基因表达数据分析已成为生命科学的研究热点。样本聚类分析能根据基因表达谱的相似程度把样本归纳成类,......
软件成本估算是软件开发过程中一项非常重要的活动,但现有的方法在准确估算软件成本方面还存在不足。针对软件成本估算不够准确的......