【摘 要】
:
实际生活中存在各种代价,包括测试代价、误分类代价、计算代价和延迟代价等。测试数据需要付出一定代价,我们称之为测试代价。这些代价包括金钱、时间和其它各种资源。当我们
论文部分内容阅读
实际生活中存在各种代价,包括测试代价、误分类代价、计算代价和延迟代价等。测试数据需要付出一定代价,我们称之为测试代价。这些代价包括金钱、时间和其它各种资源。当我们对实例做出错误分类的时候,同样也需要付出代价。这些由错误分类造成的代价,我们称之为误分类代价。等待而没有做有意义的事情所浪费的时间,我们称为延迟代价。代价敏感学习问题逐渐成为研究的热点。在数据挖掘和机器学习中,约束满足问题是一类常见而有意义的问题。在各个方面,如金融经济、组合数学,计算复杂性理论、密码安全学和应用数学等领域中约束满足问题的变类得到广泛的应用。正是因为现实世界中各种代价的存在,而很多时候我们的资源是有限的,我们所能够承担的代价并不能满足完成所有的测试或者其他代价的要求。如何利用有限的资源来尽量的完成测试需求或者其他方面需求的问题,正受到越来越多的研究人员的关注和研究分析。目前,已有不少研究者做了部分约束满足方面的研究工作,通过定义不同的约束条件来研究代价敏感约束满足问题。代价敏感学习是数据挖掘的研究热点,约束满足问题是人工智能和机器学习领域著名的问题之一。因此本文利用粗糙集知识研究这两个热点问题,提出了代价约束下的属性选择问题。研究目标是处理不同类型数据模型的代价敏感约束满足问题以及获得不同的约束条件下的高效解决算法。本文主要分为两大部分。第一部分详细研究了基于代价敏感粗糙集理论的名词性数据的属性选择问题。首先,我们提出了在时间代价约束下的随机算法来处理名词性数据的属性选择问题。时间代价约束是算法设计的一个主要目标,主要是为了在尽可能短的时间内获得良好的实验结果。其次,为了进一步降低算法的运行时间,我们在快速随机算法的基础上提出了重启策略优化的随机算法来解决最小测试代价属性选择问题。实验结果表明重启策略优化的随机算法在单位时间内能够获得最优的属性子集。重启策略优化的随机算法在处理大规模数据集有着突出的表现,不足之处就是算法在固定实验次数的情况下,实验结果差于启发式算法。在处理名词性数据的属性选择问题的最后一部分,我们提出了代价约束下的属性选择问题,首次考虑了测试代价和误分类代价对于约束问题的影响。基于测试代价和误分类代价对代价约束下属性选择问题的影响,我们提出了一类新的启发式算法。实验结果表明,我们设计的算法能够在代价约束下获得不错的效果。第二部分详细研究了同时考虑测试代价和误分类代价这两类代价的数值型数据的代价约束属性选择问题。在处理数值型数据的问题上我们采用了邻域粗糙集的相关知识。通过计算对象的不一致对象个数,我们设计了一类新的启发式算法来解决数值型数据的代价约束属性选择问题。实验结果表明,我们设计的启发式算法能够在算法效率和效果方面获得不错的结果。
其他文献
英语口语是一种重要的语言能力,然而在过去的英语语言教学中,老师忽视了英语口语教学这一点,把精力过多地放在传授语法知识、记忆单词等方面。因此,许多学生在英语考试中能够拿到
摘要:当今时代,人们的精神文化需求逐渐发展壮大起来,人们对于建筑设计的要求不再停留于居住和休息的层次,建筑设计中的审美设计以及其中的文化机制展现近年来日益成为人们关注的重点。建筑设计和审美作为一种文化创新的表现,在现代社会呈现出了良好的发展态势。本文通过分析建筑设计和审美中展现出的文化冲突与融合,谈论了这种建筑设计和审美的创新文化机制对于建筑设计的推动作用。 关键词:建筑设计;审美设计;文化机制
针对泉店煤矿属中央并列式通风,负压较大,进回风巷之间的风门难以开启,给安全生产带来很大隐患,提出了风门开关装置的设计方案,经过现场使用,方便省力经济,促进了矿井安全生
摘 要:城市道路的质量对城市交通影响甚大,路基是道路的结构主体,是道路工程质量最大的影响因素;市政雨污水管线工程是城市运转的重要保障,道路雨水能否及时排泄关系着人们的日常生活;本文就市政道路与排水工程施工质量影响因素与控制加以分析。 关键词:市政路基;道路排水;影响因素 Abstract: The quality of the urban road the great impact of ur
我们所要解决的问题是根据美国艾滋病医疗机构ACTG公布的两组数据,对已接受治疗的艾滋病患者的继续治疗效果进行预测,确定了最佳治疗的终止时间,同时考虑四种药物的价格与治疗效
要加快发展慈溪的加工贸易,必须进一步贯彻落实党的十五大精神。加快“三外联动”、“主体外向转移”战略的实施步伐,东南亚金融危机既是挑战,又是机遇,要确立新的发展思路
摘要: 本文根据市政工程施工案例,就深层搅拌桩施工质量控制、对策制定与实施、搅拌 桩质量检验及经济效果等问题进行了介绍和分析。 关键词:市政工程;深层搅拌桩;质量控制;检验 1工程概况 某标段工程为市政道路,路幅宽50米,设计时速为60km/h。 本标段为海相沉积兴化平原地貌单元,场地地下水主要赋存于卵石、残积砂质粘性土和风化基岩的孔隙中,地下水类型为承压水,稳定水位埋深0.0
在现实生活中存在着碰撞和干摩擦等非光滑因素,包含非光滑因素的系统一般称之为非光滑系统。相对于光滑系统,非光滑系统表现出强非线性和奇异性的特征。碰撞振动系统是非光滑系
摘要:建筑业是我国国民经济的重要支撑力量,建筑机电安装则是建筑业中一项重要的施工程序。它影响着建筑施工的质量安全和施工安全。建筑机电安装的施工技术也是要求比较严格的,在施工前需要做好施工准备,使工作中注意把握施工技术,施工或做好检测措施。本文主要对建筑机电安装施工技术管理的措施进行了简要的分析和概述。 关键词:建筑机电安装施工技术管理措施 建筑工程项目施工中,如果没有机电安装的保证,就没有施工
二十世纪二十年代,芬兰数学家R.Nevanlinna引进了亚纯函数的特征函数,并建立了两个基本定理,从而创立了Nevanlinna值分布理论.他所刨立的这一理论是二十世纪最重大的数学成就之