数据挖掘技术在特殊天体发现中的应用研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jingyu0722
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着LAMOST大型观测项目的开展,每个观测夜将获得上万条光谱。天体光谱蕴含着天体的重要信息,因此光谱分析在天体研究中占有重要地位。由于天文界对宇宙的认识还比较有限,LAMOST巡天计划的一个重要任务是要发现一些新的、特殊类型的天体,所以如何利用数据挖掘技术从海量天体光谱数据中发现未知的、特殊的天体及天体规律是非常值得研究和探索的。数据挖掘技术在众多领域中得到广泛的应用,运用数据挖掘技术可以实现相关性预测、分类、聚类、孤立点发现、时间序列分析等许多功能。许多针对高维数据的挖掘算法也正成为研究的热点,而光谱数据本身正是高维的,因此,面对海量的光谱数据,数据挖掘技术中的发现离群点的方法,可以为发现特殊天体提供很好的支持。按照LAMOST的科学目标,光谱数据可以分为粗分类和细分类两大部分。其中粗分类是指首先将天体光谱分成正常天体和发射线天体,然后将正常天体分成正常星系和恒星,发射线天体分成星暴星系和活动星系核。本文正是在粗分类后的得到的数据的基础上进行数据挖掘,来发现特殊天体。本文的主要工作有:(1)面对恒星光谱高维的特点,本文采用了PCA方法构造光谱的主分量,把光谱中的主要特征提取出来。采用主分量为轴,直接把样本点在主分量坐标轴上进行投影,可以得到二维平面上的样本特征点,大大降低了光谱数据的维数。(2)研究了密度聚类算法的基本知识、基本理论,分析了密度聚类算法的优缺点。针对本文是以发现特殊天体为目标,对DBSCAN密度聚类算法进行了改进,提出了以DBFO算法。此算法以最短成簇距离为基础,对所有对象按距离长短排序,最终以发现离群点为目的。(3)根据数据挖掘的一般步骤,从特殊天体挖掘的角度出发,构建了基于天体粗分类数据的特殊天体挖掘系统,并对挖掘流程、系统模块设计做了介绍;主要包括数据预处理,降维投影,聚类等模块;然后用Matlab来展示挖掘得到的特殊天体。最后对通过对实验结果的分析,对比DBFO算法和系统树方法聚类的优缺点。并通过实例展示了发现的特殊光谱和普通光谱的不同。
其他文献
负载均衡是集群技术的重要性能之一。为了提高网络的数据处理能力和节点利用效率,优化的任务调度算法已成为集群网络研究的重要内容。遗传算法(GA)采用群体搜索技术,具有隐含
社会的进步与发展要求各行业的管理工作日趋规范化和科学化。许多行业为了确保安全生产都开展了巡检工作,也要求对巡检工作实行规范化管理。铁路巡线是一项非常重要的工作,事
随着数据库和时态信息技术的迅速发展,时态信息处理技术的应用领域越来越广阔,时态信息的应用已渗透进各行各业中。对时态信息的索引效率的要求越来越高。 本文针对时态信息
管理信息系统已很好的解决了结构化问题,但在实际应用中存在着许多较为复杂的半结构化和非结构化问题需要解决,决策支持系统应运而生。 沙化土地的综合治理和合理利用是宁夏
本文课题来源于台湾致伸公司与中山大学图形图像技术实验室的合作项目:“基于监控内容的视频索引与检索”,该项目的目的是通过对视频序列进行处理、分析和理解、建立结构和索引
认证、授权和计费,即AAA(Authentication、Authorization、Accounting),是目前通信网络的基本功能之一,因此AAA服务器在电信行业的业务中有着极其重要的作用。虽然Diameter在
计算机视频取证是当前世界上机器视觉研究领域中的一个研究热点,它结合人工智能、计算机图形学、模式识别等研究领域的成果。主要研究目的是在海量的视频库中快速准确地定位犯
学位
基于内容的视频拷贝检钡(Content-Based Video Copy Detection)是视频版权保护与内容管理的重要技术手段之一,是通过屏蔽视频的视觉表现形式,提取视频内容信息指纹,度量指纹
随着网络带宽的飞速提升,利用可移动设备接收查看多媒体信息已经成为人们的迫切需求。传统多媒体文件通常体积很大,下载需要很长时间,而且只能先下载,存储在存储器上之后再播
边缘检测及定位技术在图像处理中占有重要的地位和作用,随着机器视觉技术在检测和测量中广泛深入的应用,人们期望能从图像信息中获取更为精确的物体的尺寸和位置信息,像素级
学位