大规模数据的多视角、多任务分类/聚类方法及应用研究

来源 :江南大学 | 被引量 : 5次 | 上传用户:xiaogouku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是人工智能的重要研宄课题之一,而分类和聚类是机器学习中的两个重要的研究课题,已广泛应用于自然语言处理、生物特征识别、计算机视觉、语音识别和图像识别等领域。目前,虽然面向大规模数据集的机器学习方法得到了较深入的研究,也获得了大量重要有价值的研究成果并广泛地应用于实际生产中,但仍有许多问题需要进一步的探索和研究。本课题主要是面向大规模数据集,从模糊聚类中模糊指数一般化、改善核化大规模数据分类的泛化性能和大规模数据分类的损失函数等3个方面给予重大关注,并进行深入研究。主要贡献如下:(1)针对基于FCM算法框架的竞争聚集聚类算法CA中模糊指数m被限定为2的问题,提出了一种更为普适的模糊聚类新算法。该算法首先在FCM算法框架的基础上引入熵指数约束条件构造了基于熵指数约束的模糊C均值聚类算法EIC-FCM成功地将模糊指数m>1的约束条件转换为熵指数0<r<1的约束条件,经分析该算法具备与经典FCM算法可比较的聚类性能。其后进一步在EIC-FCM算法的框架下融入竞争学习机制得到了基于熵指数约束的竞争聚集聚类算法EICCA,该算法由于使用(0,1)范围的熵指数约束而不再受到模糊指数仅为2的限制,增强了算法的适应性且更具普适性的特征。在模拟数据集以及UCI数据集上的实验结果同样表明,EICCA方法较之经典的CA算法性能更为优越,参数的选择更为灵活。(2)为了提高核化两类L2-SVM的泛化性能,将多视角学习引入核化两类L2-SVM提出了多视角学习模式分类算法Multi-view L2-SVM,证明了核化两类Multi-view L2-SVM亦为中心约束最小包含球并由此提出了多视角核心向量机MvCVM。所提出的Multi-view L2-SVM和MvCVM既考虑了视角之间的差异性,又考虑了视角之间的关联性,使得分类器在各个视角上的学习结果趋于一致。人造多视角数据集和真实多视角数据集的实验均表明了Multi-view L2-SVM和MvCVM方法的有效性。(3)为了提高罗杰斯特回归LR的泛化性能,将间隔参数引入LR模型提出了软间隔分类模型v-SMLRC,利用多任务学习将正则化参数和间隔参数引入LR模型提出了软间隔多任务分类模型v-SMMTL-LR。证明了v-SMLRC对偶和v-SMMTL-LR对偶均为一等式约束CDdual并由此提出了适合于大规模数据的v-SMLRC-CDdual和v-SMMTL-LR-CDdual。所提出的v-SMLRC-CDdual和v-SMMTL-LR-CDdual既能最大化类间间隔,又能有效提高罗杰斯特回归LR的泛化性能。大规模文本数据集实验表明,v-SMLRC-CDdual和v-SMMTL-LR-CDdual分类性能优于或等同于相关方法。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
视频人体行为识别作为模式识别和计算机视觉领域的热点研究方向之一,在智能视频监控、人机交互、异常行为检测、视频检索等方面具有广泛的应用前景。行为识别研究的目的是利
“三鹿奶粉事件”精辟透彻地诠释了“做企业就是做良心”之真谛。良心是企业搞好经营管理最基本的道德价值理念。企业坚守良心,具有双重的价值和意义,它既能造福消费者又会推动
本文是作者系列研究高速铁路架梁方法与机械设计方案第二篇。本文介绍与分析了大桥局船舶工程总公司为秦沈客运专线月芽河特大桥之架桥机的设计方案。
为了解黑龙江省大兴安岭地区水中氨氮含量现状,作者对大兴安岭各类型水进行了氨氮含量分析。结果表明南翁河区域河水与地表径流中氨氮含量8、9月偏高,地表径流中氨氮含量在3.94
通过对公乌素煤矿煤层自燃防治情况的分析,结合矿井原有防灭火系统,确定在矿区南、北两翼分别建立地表注浆站;充分考虑矿井井下生产条件,优化设计注浆系统,计算确定注浆参数;
无视野重叠区域的跨摄像机行人跟踪是指运用计算机视觉、模式识别和机器学习等技术,在无视野重叠区域的不同摄像机间对相同行人进行检测、跟踪和再识别,从而实现对行人进行长
《边坡与基坑工程》是一门实践性、应用性很强的专业课程,同时也是土木工程专业岩土工程方向的核心课程.但是,目前该课程的教学中存在教材匹配度欠佳、课时安排欠合理、教学
通过对DF型内燃机车燃油系统原理和典型故障现象进行分析,找出发生故障的原因,并提出了相应的解决措施和检查步骤,降低了DF型内燃机车燃油系统故障发生的频次。 By analyzin
计算机层析成像(Computed Tomography,CT)作为一种先进的检测技术,以图像形式直观清晰地反映被测对象内部结构和性状,在医学诊断和工业无损检测领域的应用十分广泛。随着CT技