【摘 要】
:
针对现有层次聚类算法难以处理不完备数据集,同时考虑样本与类簇之间的不确定关系,提出一种面向不完备数据的集对粒层次聚类算法-SPGCURE.首先,采用集对信息粒的知识对缺失值
【机 构】
:
华北理工大学 理学院,河北 唐山063210;河北省数据科学与应用重点实验室,河北 唐山063210
论文部分内容阅读
针对现有层次聚类算法难以处理不完备数据集,同时考虑样本与类簇之间的不确定关系,提出一种面向不完备数据的集对粒层次聚类算法-SPGCURE.首先,采用集对信息粒的知识对缺失值进行处理,不同于以往算法中将缺失属性删除或者填充,用集对联系度中的差异度来表示缺失属性值,提出一种改进的集对信息距离度量方法,用于考量不完备数据样本间的紧密程度;其次,基于改进后的集对距离度量,给出各个类簇的类内平均距离的定义,形成以正同域Cs(样本一定属于类簇)、边界域Cu(样本可能属于类簇)和负反域Co(样本不属于类簇)表示的集对粒层次聚类;SPGCURE算法在完备和不完备数据都适用,最后,选用5个经典的UCI数据集,与常用的经典及改进聚类算法进行实验评价,结果表明,SPGCURE算法在准确度、F-meas-ure、调整兰德系数和标准互信息等指标上均具有不错的聚类性能.
其他文献
互连网络路由器是MPP系统的关键部件,其性能优劣直接影响系统性能.本文在mesh结构上,针对完全自适应路由算法实现难度较大的问题,在性能、代价和实现复杂性上进行合理折衷,给出了
为提高SSD算法检测目标的能力,提出了一种对多尺度特征图进行分类再提取的目标检测算法.该算法将SSD特征金字塔中多个不同尺度的特征图分为低层和高层两类特征图.针对低层特征图所处位置网络深度不够导致的特征表示能力不足,设计了SFE(Shallow Feature Enhancement)模块提取特征从而增加网络深度,最终提高对小目标的检测能力;高层特征图采用两段反卷积的方式,将更深层提取的语义信息融
传统和基于CNN的脱机手写汉字识别模型多数是为了追求更高准确率,未重视模型体积大小,模型中存在大量冗余参数,模型训练周期长并且很难在资源有限的平台上运行.针对这些问题,本文提出改进的SqueezeNet模型,保留了用小卷积核替代大卷积核的策略,采用层间的特征融合算法和L2范数约束的Softmax分类函数;然后再对参数裁剪进一步压缩,避免裁剪掉重要参数而损失过多准确率,采用动态网络手术算法来保证将误
退就要真退,百分之百地退到了中央电视台《新闻联播》节目的时间,邓小平又坐在电视机前。这个节目他每天必看,因为这是他了解世界的另一
If we retreat, we must retreat, o
人才培养模式改革是当前高等职业院校深化教学改革、提高教育教学质量的关键.山东职业技术学院围绕人才培养目标,以"三通三融三证书"人才培养模式创新为引领,强化内涵建设,全
考虑到现有的基于检测的多目标跟踪算法多会出现因目标漏检或数据关联算法冗余而造成的目标ID频繁切换、跟踪轨迹断开等问题,提出了无人车驾驶场景下的多目标车辆与行人跟踪算法.首先,选取CenterNet网络作为目标检测器,并用嵌入了1×1卷积和SE-Net的Res2Net来替代网络原有的残差单元,以提升网络对空间信息和通道信息的提取能力,提高目标检测器性能.接着,用孪生网络来提取目标所在区域的特征,进行
本文针对实际党建领域中的新闻标题进行自动生成,提出了一种融合指针网络的自动文本摘要模型-Tri-PCN.相比于传统基于编码器-解码器框架的自动文本摘要模型,党建新闻标题生成
摘 要:随着改革开放和经济的发展,美国影视剧中国愈加流行,字幕翻译也成为一种新兴行业。本文首先简要介绍美国影视剧字幕翻译现状,以及影视剧字幕特点,然后在目的论的指导下,以美国动画情景喜剧《普森一家》为例,对《辛普森一家》字幕翻译所体现的目的论原则进行切实分析。 关键词:目的论;辛普森一家;字幕翻译 一、我国字幕翻译的现状 互联网的快速发展,冲击传统电影电视公司的字幕翻译地位。随着中国互联网的
Yue Meiti has been in Kun Opera for 41 years. The long career is filled with honors in the field and beyond. She is a deputy to Shanghai People’s Congress, and
全国职业教育会议、《国务院关于大力发展职业教育的决定》和《国家中长期教育改革和发展规划纲要》,把大力发展职业教育作为今后一个时期我国教育发展的重要战略,把提高质量