不确定与带容量约束聚类问题的近似算法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:flysky1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类问题是计算机科学和运筹学领域中的经典问题,具有广泛的实际应用背景.本论文通过设计近似算法,对球面k-平均问题,设施选址问题和关联聚类问题三种聚类问题的变形进行研究.主要研究内容为:带惩罚的球面k-平均问题,带惩罚的容错施选址问题,两阶段随机容错设施选址问题、不确定关联聚类问题以及容量约束关联聚类问题.文章基于线性舍入技巧、初始化技巧和贪婪增广设计上述变形问题的近似算法并给出相应的理论分析.在带惩罚的球面k-平均问题中:给定分布在单位球面上的数据点的集合,正整数k,每个点的惩罚费用以及两点之间的距离,每个数据点可以被聚类也可以被惩罚.问题的目标是区分被惩罚的点和被聚类的点并将被聚类的点分成k类,使得被聚类的点到其对应中心的距离的和与总的惩罚费用的和最小.模型的提出有效的避免了个别点对整体造成过度的影响.该问题的难点在于如何选择k个中心点使得可以从理论的角度来分析算法的好坏.我们首先基于初始化技巧对一般实例给出了 2Mmax{2,M}(1+M)(lnk+2)-近似算法.其次证明了对于可分实例,算法以概率[(4max{5,M+1})1-k]/2实现近似比2max{3,M+1},其中M为实例中最大的惩罚费用与最小惩罚费用的比值.在带惩罚的容错设施选址问题中,给定设施的集合,顾客的集合,设施的开设费用以及顾客与设施之间连接费用,每个顾客的连接需求及其权重向量和惩罚费用的向量.顾客的每个需求可以被连接在一个开设的设施上也可以通过支付对应的惩罚费用被拒绝.目标是挑选一些设施开设,拒绝部分顾客的部分需求并满足剩下的顾客的需求来极小化总的设施费用,带权的连接费用以及惩罚费用的和.模型的提出有效的避免了个别点对整体造成过度的影响.在本论文中我们利用线性舍入技巧来设计近似算法,该技巧的难点在于分数最优解并不能很好的反应解的结构从而很难识别被惩罚的顾客.为了克服这一难点,我们首先在分数最优解的基础上构造了一个费用不增加但能较好的反应解的结构的分数可行解.其次在构造的分数可行解的基础上通过引入待定参数来识别被惩罚的顾客.最终通过一定的技巧来选择开设的设施来得到整数可行解.我们证明了该算法是4-近似的确定的算法并进一步利用随机舍入的技巧将近似比改进到3.16,最终通过贪婪增广技巧将近似比改进到2.408.在两阶段随机容错设施选址问题中,给定设施的集合和顾客的集合,设施在两个阶段的开设费用以及设施与顾客之间的连接费用,K个不同的场景对应的顾客集合及其概率分布,每个场景下顾客需要连接的设施的个数及其权重向量.设施的开设分为两个阶段,第一个阶段中开设的设施可以服务所有场景下的顾客,第二个阶段下针对不同场景开设的设施只能服务对应场景下的顾客.目标是分两个阶段开设设施并且保证每个场景下的顾客都能连接在一定数目的开设的设施上来极小化第一阶段的设施费用和K个场景下设施费用和带权得连接费用的期望.模型的提出有效的克服了单一变形无法刻画实际问题的局限性.论文基于线性舍入技巧计近似算法,该技巧的难点在于分数最优解并不能反映解的结构.为了克服这一难点,我们在分数最优解的基础上构造了一个可以更好反应解的结构的分数可行解.在本论文中,我们利用上述技巧得到5-近似的确定的算法并进一步利用随机舍入的技巧将近似比改进到3.8617.在不确定关联聚类问题中,给定完全图以及每条边成为正边的概率.问题的目标是将图中的顶点分为若干类来极小化两个顶点在不同类的正边以及两个顶点在同一个类的负边的个数的期望.该模型的提出有效的克服了当前的算法只能处理确定图上的关联聚类问题的局限性.论文利用线性舍入技巧来设计近似算法,该技巧的难点在于如何基于分数最优解来识别出应当被聚到一类里的点的集合.为了克服这一难点,我们引入待定参数给出了一个聚类的准则,并通过恰当的选取参数得到了 6-近似的算法.在容量约束关联聚类问题中,给定完全图G=(V,E),其中V是顶点的集合,E是边的集合.每条边根据其关联的顶点的相似性有一个标号+或-.每个顶点v∈V对应了正整数Uv.目标是将顶点分为若干类来极小化标号为+且两个顶点在不同类里的边和标号为-且两个顶点在同一类里的边的个数和.并且算法输出任何类C满足|C| ≤minv∈CUv.本论文利用线性舍入技巧来设计近似算法,我们首先基于待定参数α∈(0,1/2]给出了(1/(1-α),2/α)-双准则近似算法,即算法输出的解对应的目标函数值不超过最优解的2/α倍且算法输出的每个聚类C满足|C| ≤minv∈CUv/(1-α)其次我们通过限制每个类里顶点的个数给出了2U-近似的算法,其中U=maxv∈VUv.
其他文献
随着我国经济的飞速发展,资本市场的发展也日趋繁荣。但是在这资本市场繁荣发展的背后,上市公司财务舞弊问题也随之暴露出来,近几十年,上市公司财务舞弊案件被频频爆出,上市公司为了达到粉饰报表的目的,通过财务舞弊的现象屡禁不绝,并且愈演愈烈。它不仅损害投资者和其他利益相关者的权益,打击投资者对资本市场的信心,扰乱资本市场公平交易的秩序,甚至会阻碍社会经济的健康发展。因此,防范与治理财务舞弊是保证资本市场健
当前网络直播、短视频等娱乐产业迎来了其发展的最佳时期,在民众娱乐需求不断增强的背景下,这些新兴的信息娱乐产业结合移动互联网技术,不断扩展其市场占有份额。但是娱乐性强、互动程度高的网络直播平台不断涌现的同时,该产业也在不断暴露其迅猛发展所潜伏的风险因素。当前很大一部分网络直播平台存在涉黄涉暴、侵犯隐私、涉嫌诱骗等问题,对社会安定和公众利益产生较大的侵蚀。对于网络直播平台这一新型媒体,我国政府监管亟待
近年来,翻转课堂在国内外中小学教育中被广泛应用,且随着互联网的迅猛发展及“互联网+”概念的大力推广,在线教育也越来越受人们的青睐。翻转课堂的开创使得人们对教育模式的概念有了颠覆性的改变,打破了过去一成不变的“课上教,课下练”的教学模式,为个性化学习带来了更多的发展空间。如今,随着移动互联技术的迅猛发展,优质的学习资源越来越公开化。学生能够通过互联网获取高质量的学习资源,使其在课程知识的获取上不再高
产权制度是社会经济制度的基本组成部分,它既是经济高效运行重要基石,也是市场及其他制度安排的根基所在。目前,我国正处于供给侧结构性改革的持续深化阶段,产权改革得完善与否直接关系着产品的供给质量与资源的利用效率,进而影响着整体社会主义经济改革的进程。因此,优化产权结构仍是我国经济改革的重中之重。以马克思为代表的政治经济学产权理论和以科斯为代表的西方产权理论对中国改革实践的指导意义重大。本文分别阐述了马
“时间透视”(“temporal perspective”)是指在读者的具体化活动中,文学作品总是在一种歪曲变化的时间外观中呈现给读者。这一现象与文学作品的“类时间结构”相联系,是作为时间性艺术的文学作品呈现于具体化过程中的本质特征的结果,理解这一现象对文学作品的整体审美理解有着重要作用。从现象学的观点来看,文学作品是在一个现象学的时间过程中展开和被感知的,读者跟随作品的展开获得不同的时间角度,但
本论文将陈独秀和鲁迅的文化身份界定为社会/文明批评家,这是以社会批评和文化批判为宗旨的一类写作者,是不同于文学家、思想家或革命家的一种独特身份。这类作家具有独特的思维和写作特点,独特的价值诉求和社会功能。根据这一文化身份定位,本论文尝试将鲁迅和陈独秀的绝大多数写作成果,不管是文学的还是非文学的(如杂文、日记、书信、序跋)都视作社会/文明批评的实践。以两位批评家五四时期的批评文本为中心,再结合两人的
宁波中欧国际班列(以下简称“甬新欧”)于2014年8月正式启运,四年多来,在集货能力、运行频次、管理水平等方面都实现长足进展,但随着工作量的日渐繁重,在运营过程中也出现一
改革开放40年以来,我国经济实现了持续且快速地发展,但在这其背后却有着东中西部地区经济差距逐步扩大的既定事实。虽然已有研究都表明对于这种地区经济发展不平衡的现象是一
基于茶文化视阈下看园林景观设计活动,是一种文化理念的诠释,也是景观设计最大价值的体现,更是我国历史中传统茶文化的延续与发扬。园林设计讲究“天人合一”,追求人文价值、审美价值与实用价值三者的高度结合,而茶文化的引入与园林设计的内在需求不谋而合。基于此,园林景观中要追求寓意于物的表现形式,彰显美学思想,从而为大众提供美学享受与熏陶。巧借茶文化元素,为园林景观设计赋予传承性与创新性,从而切实深化园林景观
经济的快速发展带动餐饮行业蒸蒸日上,餐饮行业内的竞争愈演愈烈,想要提高连锁餐饮企业的市场竞争力就必须控制好成本,成本对餐饮业发展起着至关重要的作用。战略成本管理是战略思想在成本管理的具体应用,是为了获得和保持企业持久竞争优势而进行的成本分析与管理,战略成本管理比传统的成本管理具有长期性、前瞻性、战略性等特点,是以长期的目标为规划原则,考虑了竞争环境中的横向对比,综合了更为全面的影响因素,更有利于长