【摘 要】
:
随着互联网、计算机技术的快速发展以及智能手机的普及,人们生活更加数字化和智能化,与此同时,各种文本或日志数据等在爆炸式地增长。如何快速地对这些数据进行有效分类并从
论文部分内容阅读
随着互联网、计算机技术的快速发展以及智能手机的普及,人们生活更加数字化和智能化,与此同时,各种文本或日志数据等在爆炸式地增长。如何快速地对这些数据进行有效分类并从中挖掘出有用的价值信息逐渐成为人们日益关心的问题。自动分类技术已经成为机器学习领域的研究热点,因为它能快速地进行分类,减少人工进行分类的成本,提高工作效率。针对样本类别数较少、数据量较大的多类分类问题,提出了一种基于1-a-1和组合凸线器的多类分类算法。该算法对于有N个类别的训练样本,用1-a-1的方法训练N(N-1)/2个组合凸线器二分类器,对于每一个待分类样本,用所有的二分类器去进行分类,最终根据每个类别所得的票数决定所属类别。在Reuters 21578数据集上进行的分类实验结果表明,相对于支持向量机1-a-1算法,本文算法在保证分类精度和训练速度的同时,分类速度有了显著提高。针对样本类别数较多、数据量较少的多类分类问题,提出了一种基于1-a-r和组合凸显器方法的多类分类算法。该算法对于有N个类别的训练样本,采用一对其余的方法训练N个组合凸线器二分类器,对于每一个待分类样本,用所有的二分类器去进行分类,最终根据样本的票数情况判定其所属类别。在Reuters 21578数据集上进行的实验结果表明,相对于1-a-r SVMs,本文算法明显提高了分类准确度和分类速度。针对多类分类算法1-a-1和1-a-r存在不可分区域问题,提出一种基于组合凸线器和Hadamard编码的多类分类算法,首先利用Hadamard编码对每一类样本进行编码,然后依据编码矩阵的列向量信息将多类分类问题转换成多个二分类问题,并对每个二分类问题训练组合凸线器,最后由汉明距离来决策待分类样本的归属。在Reuters 21578数据集上进行的分类实验结果表明,与多类分类算法1-a-1 SVMs、1-a-r SVMs和DAGSVM相比较,该算法提高了分类精确度和分类速度,且具有良好的鲁棒性。
其他文献
相比欧美发达国家,当前我国家庭在资产配置上面临储蓄率过高、房产投资过度和金融市场参与不足等问题。根据当前欧美发达国家家庭资产配置结构现状可以预见:随着我国城镇化进
在慢性感染或癌症的发生过程中,T细胞长期暴露于持续的抗原刺激或炎症信号,导致T细胞以分级的方式逐渐失去效应功能,通常称为T细胞耗竭(T cell exhaustion)。T细胞表面PD-1、CTLA-4、LAG-3、Tim-3和BTLA等抑制性受体高表达和共表达是耗竭T细胞的主要特征之一。本课题组前期的研究中,已经用差速离心法从多种小鼠/人肿瘤细胞培养上清以及肿瘤患者胸/腹水中成功募集到分泌型自噬
自由电子激光(FEL)可提供波长连续可调、高亮度、高相干性的短脉冲辐射,是原子分子物理学研究中一种重要的科学技术。目前,FEL主要朝着超短脉宽、超高强度、高相干性等方面发
泛素化修饰作为蛋白质翻译后修饰的一种常规修饰,在调节细胞各种过程中执行着非常重要的作用。经典的泛素化修饰主要通过E1泛素激活酶,E2泛素结合酶以及E3泛素连接酶对泛素的级联传递最后将泛素修饰到底物上,调节底物蛋白的稳定性、酶活性、细胞定位等。2007年,Daniela Hoeller等科学家提出在体外泛素化反应时,没有E3泛素连接酶参与的条件下底物蛋白通过泛素结合结构域(ubiquitin bin
随着计算机技术的不断发展,越来越多的大型专业应用软件在电力部门得到了广泛应用,之前需要人工完成的工作已逐步被计算机所替代。目前国内的很多供电企业在配电网的自动化水
目的 通过与传统的后腹腔镜保留肾单位手术(Retroperitoneal laparoscopic nephron-sparing surgery,RLNSS)的临床效果比较,评价 ZS 评分(zhongshan score)指导下经皮超选择
泛素化修饰是一种广泛存在于真核生物体内的蛋白翻译后修饰,它是一个多酶级联反应,涉及到E1泛素激活酶、E2泛素结合酶和E3泛素连接酶,此过程还需要其它分子,如ATP、Mg2+等的参与。泛素化过程与机体的多种生理功能调控相关,如细胞的增殖分化、信号转导、蛋白定位、DNA损伤修复、自噬、生长发育和凋亡等。在人的细胞中有2个泛素激活酶(E1)、40多个泛素结合酶(E2)以及600多个泛素连接酶(E3)。体
无线传感器网络作为分布式网络的一种,被大量投入到战争和生活中,应用于军事国防、环境保护、灾害预警、医疗卫生、智能交通、智能家居等多种领域。由于无线传感器网络使用无线通信技术传输数据,所以易受到攻击,从而导致网络敏感数据的泄露,严重影响网络安全。因此无线传感器网络中的特殊节点的隐私保护越来越受到重视。无线传感器网络的位置隐私保护主要分为两方面,分别是源位置隐私保护和基站位置隐私保护。本文将在现有无线
为解决催化重整制氢技术中受热力学平衡的限制,实际制氢过程远远达不到理论最大氢气产量和由于积碳生成阻碍了反应器的传热传质性能的问题。研究人员利用流化床反应器内的渗
企业投资决策是金融学研究的核心问题之一。投资过程本质上是产品的跨期转换,这个过程中的边际转换率即为资本回报率,如果已知资本回报率,则可以得到投资的需求理论(Cochrane