【摘 要】
:
聚类通常被认为是一种无监督的数据分析方法,然而在实际问题中可以很容易地获得有限的样本先验信息,如样本的成对限制信息.大量研究表明,在聚类搜索过程中充分利用先验信息会
【机 构】
:
西安电子科技大学智能信息处理研究所
论文部分内容阅读
聚类通常被认为是一种无监督的数据分析方法,然而在实际问题中可以很容易地获得有限的样本先验信息,如样本的成对限制信息.大量研究表明,在聚类搜索过程中充分利用先验信息会显著提高聚类算法的性能.首先分析了在聚类过程中仅利用成对限制信息存在的不足,尝试探索数据集本身固有的先验信息——空间一致性先验信息,并提出利用这类先验信息的具体方法.接着,将两类先验信息同时引入经典的谱聚类算法中,提出一种密度敏感的半监督谱聚类算法(density-sensitivesemi-supervisedspectralclusteringalgorithm,简称DS-SSC).两类先验信息在指导聚类搜索的过程中能够起到相辅相成的作用,这使得DS-SSC算法相对于仅利用成对限制信息的聚类算法在聚类性能上有了显著的提高.在UCI基准数据集、USPS手写体数字集以及TREC的文本数据集上的实验结果验证了这一点.
其他文献
文章分析了我国企业常见股权激励模式的特点,并提出了选择激励模式应考虑的因素。
以偶氮二异丁腈为引发剂、聚乙烯基吡咯烷酮为稳定剂、乙醇-水混合溶剂为分散介质,对丙烯酸叔丁酯的分散聚合行为进行了研究。考察了分散介质组成、单体用量、引发剂用量和稳
电子标识系统作为一种快速发展的定位技术,在地下管线定位技术领域占有重要的地位。基于射频识别技术的电子标识系统代替传统的地下管线探测技术,实现对地下管线的动态跟踪管理
近年来,糖尿病发病率呈上升趋势。糖尿病已经成为我国重大的公共卫生问题,因此加强社区服务对糖尿病健康管理很有必要。本文对我国糖尿病的健康管理发展现状进行了阐述,并对
企业创新是人类创新活动的主题。系统和深入研究企业创新是关系到企业核心竞争力强弱的大问题,而企业的成败经常归因于企业文化。文章从创新企业文化的涵义和重要性入手,阐明
小学语文课程内容丰富,包含对古今中外人物事件以及未来世界的讲解,是使学生对世界产生兴趣的重要课程。如何使学生学好小学语文,就要充分做到学生在课堂上的“六个意识”回
利用PRO/Ⅱ化工流程模拟软件,建立了乙苯脱氢制苯乙烯工艺全流程的数学模型。选用SRK方程、PR方程、SRKM方程计算各操作点物系的汽液平衡和流体物性;确定的流股收敛方法及模
<正>杨岘,字季仇,一字见山,号庸斋,晚号藐翁(66岁时以藐视上官被劾,归而署号曰藐翁).浙江归安(今湖州市)人,生于清嘉庆二十四年(1819),卒子光绪二十二年(1896),为晚清书法名
用药差错,不仅对患者身体健康及生命安全造成严重威胁,同时对医院声誉造成很大影响,必须引起药剂科人员的高度重视。笔者结合自身实际工作经验,对用即可用药差错产生原因进行
林业碳汇具有经济价值和生态价值。从我国目前林业碳汇的现状来看,还存在法律法规不完善,相关主体的利益补偿机制不明确等问题。本文在明晰林业碳汇权利内涵与特征基础上,提