【摘 要】
:
针对现有的树聚类算法不能适应数据的动态变化和不确定性等问题,研究不确定数据的聚类问题,提出一种在不确定树数据库中的动态聚类算法,有效地解决了因数据的动态变化而导致
【机 构】
:
吉首大学软件服务外包学院,湖南张家界,427000吉首大学软件服务外包学院,湖南张家界427000;武汉大学信息资源研究中心,武汉430072;
论文部分内容阅读
针对现有的树聚类算法不能适应数据的动态变化和不确定性等问题,研究不确定数据的聚类问题,提出一种在不确定树数据库中的动态聚类算法,有效地解决了因数据的动态变化而导致的无法聚类的问题.首先,提出转变树集、相似分组和树类集等概念来描述一个不确定树数据库的聚类模型.其次,为了更加准确的度量子树之间的相似性,考虑到子树即具有结点语义特征,又具有结构化特性,提出了一种语义相似度计算方法与结构相似度计算方法,同时对两者赋予一定比例的权值并求和得到最终的相似度.再次,设计了一个动态聚类过程,采用自适应获取聚类阈值,较大程度上减少了人为干扰导致聚类结果不准确的影响,使得具有相似结构的子树聚集在同一个相似分组中,不同分组之间的子树相似度达到最小化,同时对每个相似分组,定义一个提取代表性子树的公式,将其作为树类组成树的类集.最后,通过模拟数据和真实环境两部分实验可以表明,算法有效可行,聚类结果较准确且具有较好的运行效率.
其他文献
我国近些年城市化进程脚步的持续发展促使高层建筑数量逐渐增多,土建施工技术在建筑建设中有着十分广泛的应用,并且发挥了重要的价值.建筑有着较深的基础、较多的层数,这对施
学校基本情况 长春市第八十九中学是一所底气十足、朝气蓬勃的古老而又年轻的学校。学校拥有计算机网络系统、闭路电视系统、电话通信系统、广播音响系统等四大校园网系统
受自然及社会条件影响,建筑项目的投入资金大、周期较长、技术水平要求高,导致建筑施工企业的工程造价问题较为复杂,且风险大.加强风险管理是有效开展建筑施工企业工程造价工
在分析贴片头运动控制系统的数学模型的基础上,运用PID+速度/加速度前馈控制律消除了由系统干扰引起的稳态误差。在MATLAB/Simulink环境下,将功能模块与m函数相结合,构建了贴片头运动控制系统的仿真模型。在T形和S-曲线速度轮廓运动模式下,模型的仿真结果与理论分析一致,验证了该方法的合理性和有效性。该方法为贴片头控制器设计和调试提供了新思路。
中国内陆盐碱水域广阔,但鱼类养殖品种单一,渔业生产力低下。引进国外鱼类新品种———卡拉白鱼,旨在改变盐碱水域的生产性能,为水产养殖业带来显著经济效益。文章阐述了以渔改碱
多媒体技术在小学语文教学中的有效应用,可以激发学生的灵感,触动学生心灵,化繁成简,突破难点,优化课堂教学结构。为语文素质教育提供了新的突破口,对提高学生的语文素养有积
我国目前的小区建设工程来看,其属于一个相对较为复杂并且庞大的系统.然而如果想要进一步的提高小区的整体建设水平,首先需要针对于小区的工程质量严格控制,同时还需要不断的