【摘 要】
:
在对大型数据集的决策树生成方法进行探讨的基础之上,提出了一种基于属性关联近似正交表的决策树生成算法。该算法既能处理大型数据集,保留了基本划分组合算法的高效性,又能对提高决策树的精度具有一定的作用。
论文部分内容阅读
在对大型数据集的决策树生成方法进行探讨的基础之上,提出了一种基于属性关联近似正交表的决策树生成算法。该算法既能处理大型数据集,保留了基本划分组合算法的高效性,又能对提高决策树的精度具有一定的作用。
其他文献
介绍了基于ARM9处理器的起升设备监控系统的设计与实现,通过采用32位处理器和嵌入式Linux,增强了系统性能,降低了应用程序的开发难度,使软件在功能、结构、移植性、复用性等方面都得到了根本性的提高,克服了传统以8位单片机为主的起升设备监控系统的不足。
研究了利用多速率和Network Coding,异构网络中多播的最大吞吐率问题。通过提供分层的数据,不同接收者可以接收到不同层数的数据,从而提高多播的整体吞吐率。其主要创新性在于,首先形式化描述了多速率多播的最大吞吐率问题,然后从理论上证明了该问题是NP-hard的,并且给出了最大吞吐率的上界。
将均值聚类技术应用于细胞图像的平滑和分割,在此基础上用一种更直观的图像可控细化技术获取精确的红细胞的直径和数量,并研究了血液细胞统计系统的软件技术和方法。
介绍了在普适计算时代,数字家庭中服务网关的功能,以及OSGi(Open Service Gateway initiative)的概念、特点及框架,在OSGi Release3的基础上运用Java虚拟机实现了符合OSGi规范的家庭服务网关应用。
针对现有网络扫描技术中存在的扫描静态性和分析评估功能有限等不足,在对网络扫描基本原理综合分析的基础上,进行了网络扫描技术智能化策略的分析探讨,同时提出了一个符合智能化策略的网络扫描系统概念模型。
针对汉语分词处理中未登录词识别这一难点,提出一种应用遗传算法识别的新方法。该方法扩大了分词碎片容量,将未登录词识别问题看成二值分类问题,即在预处理后产生的分词碎片中,单字存在"可组合"和"不可组合"两类,采用遗传算法先将分词碎片中的单字词确定下来,然后将其余相邻单字组合,完成未登录词识别。实验结果表明,该方法可有效地解决未登录词识别问题,提高未登录词识别的精确率和召回率。
中介者模式常被应用于多个对象需要交互的场合。使用传统的面向对象技术的实现方案容易导致代码分散,冗余代码多,可维护性低。使用面向方面技术实现中介者模式的方案,用方面来表达中介者对象,并把构建模式的同事对象所需要的代码也封装到方面中,对象的交互则使用切入点的定义与通知来实现。与传统实现方案相比,基于面向方面技术的实现方案具有代码集中、可读性强、可扩展性强等优点。
提出了一种基于有向图结构的数据关系的表示方法。这种方法直观地将数据之间的包含、信任关系表达出来,可以很方便地计算出对于某个特定的数据访问者所能访问的数据的集合和具体的访问权限,从而达到表达访问控制逻辑的目的。通过这种方法,可以把访问控制逻辑从应用层下降到数据管理层,大大简化应用系统的逻辑复杂度。
针对肝脏图像自身特点,研究了Gabor小波纹理特征在医学肝脏图像识别中的意义,提出一种基于Gabor小波纹理特征的医学肝脏图像识别方法。实验表明:引进Gabor小波纹理特征能较好地实现医学肝脏图像识别问题;与其它典型图像识别方法对比结果验证,新方法可以取得更高的识别率。
针对应用标准遗传算法对一幅灰度图像寻找最优阈值时经常陷入局部寻优的问题,提出了一种利用最大方差法和新的改进遗传算法相结合对图像进行分割的方法。以灰度图像的最大方差作为适应度函数,把图像分割问题变成一个优化问题。利用遗传算法的寻优高效性,搜索到能使分割质量达到最优的分割阈值。实验结果表明,采用新的改进遗传算法和最大方差法相结合对图像搜索全局阈值时能收敛至全局最优解,并且大大缩短寻找最优阈值的时间。