【摘 要】
:
针对现有基于几何结构的聚类有效性指标不能有效解决不同结构数据的聚类结果评价问题,提出了一种使用分类对聚类结果进行评价的方法。该方法把聚类得到的对象类标志作为分类问题的已知类标志,使用交叉验证法对数据集重新分类,通过对比聚类结果与分类结果之间的差异来衡量聚类有效性。一个易于聚类的数据集的结构意味着也容易进行分类,对模拟数据和真实数据的实验和分析验证了该方法的可行性和有效性。
【机 构】
:
北京科技大学经济管理学院,北京科技大学冶金与生态工程学院
【基金项目】
:
国家自然科学基金资助项目(70771007)
论文部分内容阅读
针对现有基于几何结构的聚类有效性指标不能有效解决不同结构数据的聚类结果评价问题,提出了一种使用分类对聚类结果进行评价的方法。该方法把聚类得到的对象类标志作为分类问题的已知类标志,使用交叉验证法对数据集重新分类,通过对比聚类结果与分类结果之间的差异来衡量聚类有效性。一个易于聚类的数据集的结构意味着也容易进行分类,对模拟数据和真实数据的实验和分析验证了该方法的可行性和有效性。
其他文献
为优化返工情况下产品开发项目的流程,分析了基于优先规则的启发式资源分配规则的优点和不足,提出了基于信息流的资源分配规则,并利用仿真实验对资源分配规则的有效性进行了检验。仿真结果表明,提出的资源分配规则相对于基于任务顺序分配资源的优先规则和秩最大位置权重资源分配规则,能够更显著优化项目的执行时间和费用。
为准确判断网民言论与所关注话题的相关性,根据输入的关键词,运用查询扩展技术设计特征项提取和赋权算法,构造了话题向量空间模型,并提出网络舆论话题相关性算法。通过仿真实验验证话题相关性算法的有效性。该研究成果对于网络舆论分析具有应用价值。
提出了一种新的文档自动摘要方法,利用非负矩阵分解算法将原始文档表示为若干语义特征向量的线性组合,通过相似性计算来确定与用户查询高度相关的语义特征向量,抽取在该向量上具有较大投影系数的句子作为摘要。在此过程中,多次采用相关反馈技术对用户查询进行扩展优化。实验表明,该方法所得摘要在突出文档主题的同时,体现了用户的需求和兴趣,有效改善了信息检索的效率。
为进一步提高基于一种运动信息可分级模型的可分级视频编码的编码效率,减小运动信息可分级的最低码率限制,对该运动可分级模型的二维多向性进行了具体研究与改进,更新了运动估计
植物生长信息的提取与重构是在计算机上实现植物生长动态仿真的基础和关键。以树的生长为对象,将包含植物生长信息的视频图像转换为若干关键帧数据,提取反映植株拓扑结构与器官形态变化的特征信息,采用枝条拼接算法对植株拓扑变化过程进行重构。通过3DMAX开发平台对植株生长过程进行重建,结果表明该方法既能有效构建植株生长的数字化模型,又能较好地虚拟植物生长和形态演变过程。
轮廓编组是中层视觉处理的一项重要内容。轮廓编组的目的是从前阶段视觉处理中提取的低层边缘特征中找出符合人类视觉感知的显著性轮廓,这些显著性轮廓往往对应着场景中的目标轮廓。在轮廓编组中,格式塔规则对编组模型的建立有重要的指导作用。讨论了从20世纪90年代到现在的轮廓编组研究中的主要算法,将这些算法进行了分类,阐述了各个算法的提出动机及基本原理;最后,对轮廓编组研究的发展方向进行了展望。
针对云天背景下红外弱小目标的检测算法中常见的目标漏检和检测错误问题,提出了一种基于奇异值分解背景抑制和粒子滤波联合检测算法。该算法首先采用奇异值分解滤波抑制红外图像背景,获取候选目标位置;然后采用粒子滤波算法估计目标运动状态,获取目标搜索窗口;最后将单帧检测候选目标与预测的搜索窗口相结合实现小目标检测。对真实红外图像序列进行实验表明,该方法有效地解决了SVD滤波单帧漏检和粒子滤波预测错误导致的目标
提出度量多个集合之间总体差异程度的拓展集合差异度及相关定理,并给出一种新的解决分类属性高维数据聚类问题的CAESD算法。基于拓展集合差异度及拓展集合特征向量,在CABOSFV_C聚类的基础上通过两阶段聚类完成全部聚类过程。采用UCI数据集与K-modes及其改进算法、CABOSFV_C算法进行比较实验,结果表明CAESD算法具有较高的聚类正确率。
针对传统中值滤波算法在滤除椒盐噪声时的缺点,提出了一种自适应开关插值算法。该方法根据椒盐噪声的特点,通过极大值、极小值和块均匀度检测来标志噪声,然后根据噪声分布情况,利用拉格朗日插值和自适应中值滤波来滤除噪声。实验结果表明,该方法对椒盐噪声密度为10%~80%的测试图像,能更加有效地抑制椒盐噪声并很好地保持了图像的细节信息,滤波性能比传统中值滤波方法更理想。该方法为图像去噪提供了一种新的途径。
为了提高铜转炉的操作水平,探讨了利用其生产运行中产生的大量数据建立优化决策模型的方法。针对过程数据含噪声、样本规模相对不足等问题,提出了一种鲁棒性更强的改进的神经