面向数据集覆盖问题的优化算法研究

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:ylwang8866
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据科学时代,基于某些数据集训练机器学习算法是常见的。通过调查或科学实验,可以前瞻性地收集到数据集。最近,已经认识到训练数据集只具有代表性是不够的,如果受训练的系统要很好地处理一些不太流行的类别,则必须包括来自这些类别的足够的例子,这便是数据集覆盖问题。本文在已有的处理数据集覆盖问题的方法的基础上,结合关联规则挖掘相关算法的思想,提出了获取MUP的优化算法,提高了获取MUP的运行效率;另外还提出了计算coverage算法面对数据稀疏问题以及位图过大、内存不足问题的解决思路,最后通过理论分析以及对实际数据集
其他文献
改性沥青SMA在当今高速公路上得到了广泛的应用,但是在具体的施工过程中仍存在一些问题需要注意。基于此,论文主要分析了SMA沥青路面的施工控制要点和方法。
期刊
厚朴是传统中药材,厚朴酚与和厚朴酚等提取物具有抗肿瘤、抗炎、抗菌,保护与调节神经、消化系统等功效,现已被广泛应用于临床。厚朴被广泛栽培于长江流域及以南地区,形成了“
现代社会经济的不断发展对我国水利工程建设提出了更高的要求,在开展具体施工作业时,合理应用围堰技术具有不可或缺的重要价值,是其整体工程质量的重要保障,相关工作人员需要
在教育部印发的《关于全面深化课程改革,落实立德树人根本任务的意见》中,“核心素养”被置于深化课程改革、落实立德树人目标的基础地位,而校本综合实践课程的建设既要符合
稻盛和夫在短短两年时间,将曾濒临破产的日航的营业利润率从-17%提升到17%,日航成功复活,重新上市。日航的大成功使得阿米巴经营震惊世界,国内掀起了一场学习阿米巴的热潮。
目的初步探讨影响肝癌患者报告结局与生命质量的遗传因素。方法采用文献检索、生物信息查询、专家咨询、小组讨论等方法探索影响肝癌发生、发展、侵袭转移、预后、复发和遗传
近年来,随着女权主义思潮在文学领域的逐渐兴起,人们开始关注和研究男性作家创作作品中的男性话语权问题,这就相对弱化了作家在文本创作中文化和意识形成原因的探究。本文试
人工智能技术的飞速发展模式下,其被广泛运用到各行各业中,并有效提升相关信息的有效利用率,还能从不同角度进行研究分析,获取较为有效的结果。该文论述了人工智能技术背景下
料场选取的合理性直接影响整个工程的投资和施工进度,是合理确定工程投资的重要组成部分。在料场选取的方案比选中,经济性是衡量料场选取合理性的重要指标之一。