基于凸包和最近异类的样本选择算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:youtodown1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务和互联网技术的发展,数据规模日益庞大,如何在存储空间资源有限的情况下,快速、准确地分析处理数据,是目前众多大数据应用领域亟需解决的问题之一。样本选择算法通过删除数据集中的冗余样本、离群样本和噪声样本等,保留对分类器的分类过程有贡献的典型样本,在不影响数据分析性能的基础上,降低了计算资源和所需时间,成为大数据背景下进行数据预处理的重要手段之一。
  本文针对传统样本选择算法无法有效选择凹面样本,以及在大规模数据分批到达时不能有效避免分类决策面移动等问题,提出了面向支持向量机(Support Vector Machine, SVM)分类模型的样本选择算法。本文首先介绍了样本选择算法的研究进展。其次提出了基于凸包和最近异类的样本选择算法,该算法通过确定每个样本的最近异类,把具有相同最近异类的样本组成同一子集,从而将原始数据集划分为多个子集,在各子集中并行地执行凸包样本选择算法,并在此基础上,设计选择策略,选择靠近分类决策面的样本。此外,设计了一种基于最近异类的、适合数据分批到来的样本选择算法,该算法同时考虑了靠近分类决策面的样本以及远离分类决策面的样本,能够确定和保留数据的完整边界样本,当数据集因规模大而需分批导入时,也可以较好地确定分类器的分类决策面。实验结果表明了所提算法能够利用较小的样本规模获得较高的分类准确率,具有较好的样本选择性能。
其他文献
学位
学位
学位
目的:  通过随机、双盲、多中心临床研究,评价清火柔肝明目方对葡萄膜炎(VKH综合征-肝胆火炽证)治疗作用的有效性和安全性。  方法:  采取随机分组的方法,将患者随机分为两组,由申办处(山东中医药大学附属眼科医院)专人掌握盲底,当数据录入完毕后,由申办者、统计人员和组长单位参加第一次揭盲,即将各病例号所对应的组别以A、B为代号告知统计人员,以便对全部数据进行统计分析。当统计分析结束,统计报告完成
学位
目的:通过动物实验研究,建立香烟烟熏+脂多糖(Lipopolysaccharides,LPS)滴入致慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)简称慢阻肺痰热蕴肺证血虚态大鼠模型,验证越婢加半夏汤可以通过治疗慢阻肺痰热蕴肺证以改善慢阻肺症状以及其血虚状态。通过案例分析临床中治疗慢阻肺痰热蕴肺证血虚患者,观察其疗效。动物实验与临床研究相结合
桂枝汤(由桂枝、芍药、甘草、生姜、大枣组成)是治疗太阳中风的主方,能解肌发表,调和营卫,用于外感风寒表虚证。本课题组自1985年以来,以张仲景对桂枝汤功能论述为依据,运用多种实验方法,对桂枝汤进行了深入系统的研究。其中,桂枝汤解热有效部位A(Fr.A)在很小剂量即显示了明显的解热活性,并可降低发热动物下丘脑PGE含量,经LC/MS、GC/MS和化学分离确证,其内含十余种苯丙烯类化合物,此类化合物为
背景:重症急性胰腺炎(SAP)病情严重而复杂,并发症较多,预后凶险,病死率高达20﹪-50﹪,甚至达50﹪-90﹪。炎性介质等生物活性因子在AP的发生发展中的作用倍受关注。磷脂酶A(PLA)做为在炎症反应过程中起重要调节作用的酶类,在生物膜的恒稳过程、脂质介质的激活、白细胞-内皮细胞的黏附级联的形成过程中起关键性的中心环节。目前临床应用细胞因子拮抗治疗来阻断炎症反应,大都处于动物实验阶段,尚无理想
学位
水溶性差是目前开发第二代噁唑烷酮抗菌药物面对的共同难题。我们选取活性较好的Ⅱ-63、Ⅱ-74和Ⅱ-88三个化合物,结合其结构特点,进行了一系列前药化研究。研究结果发现三个化合物的磷酸酯盐在水中的溶解度都提高了1000倍以上.其中Ⅱ-74磷酸酯二钠盐Ⅲ-03经大鼠灌胃和静脉注射给药后,其血浆Ⅱ-74的暴露量分别提高了1.5倍和1.3倍,口服生物利用度由44.8%提高到52.4%。  综上,Ⅱ-74磷
学位
物资采购管理在现代企业中的作用日趋重要。在建设航天强国进程中,及时、保质保量的物资供应和保障,对于确保型号飞行试验和科研生产任务完成,是必不可少的前提和保障。总结以往经验,不乏因为在供应商准入、合同管理、质量控制、价格管控、大宗采购等关键环节发生问题,给企业和航天事业的发展造成严重影响,教训极其深刻。物资采购过程中往往蕴含较高风险,如何有效管控、降低风险,成为保持航天物资集中采购高效运转的重要研究
学位
每个国家都有其独特的工程技术标准体系,而承包商在他国承揽工程项目时可能并不熟悉项目所在国标准,这往往会给项目带来很大的风险。目前已有的研究对标准不熟悉风险在风险识别层面进行了大量分析,然而很少有研究系统地总结过应对该风险的方法,更缺少定量模型说明该风险及其应对方法对国际工程项目的影响。因此本研究收集了中国承包商的案例,结合已有研究,从中归纳出三类应对方法,然后提出以应对方法做调节变量的标准熟悉程度
学位