流形学习算法数据适用性问题的研究

被引量 : 0次 | 上传用户:bingke111888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流形学习算法作为主要的非线性降维算法已经在包括数学、生物学、医学、计算机科学等许多研究领域引起了广泛关注。流形学习算法包括等距映射、局部线性嵌入、普拉斯特征映射、极大方差展开等有效的流形学习算法和分解整合类等非连通流形学习算法,但这些算法都有各自适用的数据集,即不是对所有的数据集都适用。本文针对流形学习算法的数据集判定问题进行了研究,具体内容如下。首先,针对一个中心对称数据集合的数据类型判定问题,提出一个中心对称流形数据类型的判别算法。算法分为两步,首先利用外心近似流形的中心点,利用边界检测算法寻找流形的边界点集,然后寻找本质低维表示中距离最远的两个边界点对应在高维空间的两个边界点,通过判定这两个点的最短路径是否通过流形的中心点,来判定数据集是否为等距数据集,形成了一个解决“数据适用性问题”的思路。其次,针对非连通流形学习算法中的分解整合类算法基于等距流形学习算法对每个子数据集进行降维,使得算法不能准确得到一些子数据集的低维表示,从而影响整个数据集降维准确性的问题,提出了一个改进的综合的非连通流形学习算法。该算法在现有分解整合算法的基础上,引入了LLE基础算法,将ISOMAP和LLE都作为基础算法,并通过调整分解整合算法的基本步骤,改进了现有的分解整合算法。最后,构造了测试数据集。在中心对称流形数据类型的判别算法的实验中,用中心对称流形数据类型的判别算法对数据集进行了实验,直观展现了算法的过程,结果表明中心对称流形数据类型的判别算法能够准确判别数据集的数据类型;在综合的非连通流形学习算法的实验中,通过与过渡曲线算法的比较,可以看出本文算法准确得到了数据集的低维表示,直观展现了本文算法的优势。
其他文献
管幕工程是港珠澳大桥珠海连接线拱北隧道口岸暗挖段难度最大的项目之一,其特点是距离长、直径大、管幕轨迹位于曲线上,同时顶管精度要求高,施工难度大。工程下穿拱北口岸限
目的:探讨顺尔宁治疗稳定期慢性阻塞性肺疾病(COPD)患者的临床效果。方法:将60例稳定期COPD患者随机分为研究组和对照组,每组各30例。经2周洗脱期后,对照组采用常规治疗,研究
<正>《后赤壁赋》做于作者人生落寞时期——被贬黄州时。纵观历代有成就的作家,挫折似乎是绝好的阶梯。屈原如此,李白如此,李清照亦如此。一综"乌台诗案",差点儿没将苏轼置于
近几年来,随着社会的发展有许多企业面临着破产,然而企业的破产清算会计有很多的问题发生,而我国目前尚没有一套完整的破产清算会计核算规范,探索破产清算会计核算及其反映,
真实是新闻的生命,鉴于目前新闻报道假新闻层出不穷,读者反响强烈不满的现状对假新闻的表现、产生原因和对策进行了初步深入分析研究。
Hough变换是一种检测曲线的有效方法,但使用传统的Hough变换来检测椭圆计算量过大。为此提出了一种新的基于Hough变换的椭圆轮廓检测方法,该方法利用椭圆中心是平面上所有点
本文以史料为依据,对先秦服饰的审美价值观与审美特性进行了论述,力图较为准确地把握先秦服饰的审美理论。
新疆地处亚欧大陆腹地,邻近中亚、南亚、西亚国家,是我国对外开放的重要门户,是欧亚大陆通道的重要枢纽。新疆发展和稳定,关乎全国改革发展稳定大局,维护新疆社会形势稳定和