基于时序聚类与复杂网络的股票分类体系构建

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lummy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能技术逐步融入到人们的生活中,为人类生活提供便利。同时,经济增长促进了财富积累,智能投资越来越受到人们的关注,人们希望通过人工智能的方法辅助进行证券投资。相较于AlphaGo等成功的人工智能案例,智能证券投资是众人博弈,具有复杂的规则和不完备的信息,是人工智能从简单应用场景向更高层次的发展。人们在进行股票投资时最重要的就是需要筛选出合适的股票,伴随我国证券市场飞速发展,股票数量众多,需要对股票市场进行类别划分从而提高投资效率。但目前市场主要按照人工方式对股票进行划分,这种方式具有时滞性,无法充分表达市场的动态变化。因此本文将使用人工智能相关方法对股票市场进行划分,从而实现既能静态的描述股票之间的关联,又能动态的表达股票市场的行情。
  本文的主要研究内容分为以下三个方面:
  构建股票的知识库,主要包含了股票的行情与属性数据集。数据是后续研究的基础,本文主要从官方网站,主流的金融服务网站以及专业的金融数据包中抓取数据,并进行多方验证,保证数据的准确性和完整性。同时采集股票的量化属性,进行筛选,获得量化因子集合,通过量化因子生成股票的量化类。
  根据股票时序数据的相似性,应用聚类算法进行类别划分。在动态时间规整(DTW)算法的基础上引入了软对齐的技巧对两个时间序列的相似性进行计算,结合近邻传播算法对股票市场进行类别划分,解决实际中无法根据市场行情变化情况动态调整股票类别的缺点。实验结果表明改进的DTW算法在时序序列相似性计算上具有更好的效果。
  根据复杂网络理论生成股票网络,运用改进的Fast Unfolding社区发现算法进行股票网络中的团体发现,生成股票类别。本文在传统的行业、地域、概念、指数、用户自定义5种类别划分的基础上进行拓展,通过添加量化类,时序聚类以及用户类,构建起更为完善的股票分类体系,从而在用户偏好的适用范围上有了明显的提高。同时,本文实现一个可视化展示系统对整个分类体系进行呈现。该系统通过自顶向下和自底向上的方法帮助用户在宏观上更好的了解市场行情,从而提高信息获取效率。
其他文献
云端融合计算是大数据发展的产物,是当前主流的一种计算范型,它是多种计算形态的结合,其发展经历了两个阶段,形成两种不同的架构:移动计算和云计算融合的云/端融合架构;边缘计算出现之后,终端、边缘节点、云计算中心三者结合的云边端融合架构。在云端融合中,计算迁移(Computation Offloading)是一种重要的计算模式,即终端设备通过向远程具有较强计算能力的设施(边缘节点或者云服务器)迁移部分计
学位
医学图像分割在临床研究中有非常重要的应用,可用于治疗可视化及手术计划等应用。虽然已经有大量人脑组织图像分割的相关研究,但是,已有的分割技术要么太复杂,要么对某些应用来说不够准确。为此,本文提出了三种新的医学图像分割算法。  首先,利用模糊水平集方法的中值滤波器来提出磁共振成像(MRI)脑组织图像的模糊分割。MRI图像用作输入图像,利用中值滤波器和模糊C均值(FCM)聚类来分别去除图像噪声并创建图像
学位
图像的相似性或失真性评估对图像处理和计算机视觉的广泛应用至关重要。已经提出了很多基于统计学的图像相似度量方法来处理特定类型的图像失真,如具有广泛应用的经典结构相似度度量技术SSIM。  由于涉及诸如头部姿势、不同类型的光照和不同面部表情之类的重大挑战,人脸识别被认为是图像相似性研究中最艰巨的挑战之一。提出了四种新的用于人脸识别的图像相似性度量方法,进而来完成人脸相似性检测和人脸识别,并对提出方法进
学位
图像相似性评估和人脸识别评估在图像处理和机器视觉领域具有广泛的应用,研究者已经提出了许多测量方法来应对图像相似性和人脸识别评估技术所面临的挑战。  本文着重从统计学和信息论两个方面研究图像识别的相似性。研究表明信息论方法和统计方法在图像识别中具有较好的性能,但混合方法在相似性判断上具有更好的效果。利用功能和通用规则对面部和非面部图像相似性评估进行了深入研究,特别研究了它们的性质及其对相似性和判别的
学位
近年来,人脸检测和行人检测是计算机视觉中非常重要的研究课题,并且取得了相当大的进展。然而,基于二者的人数统计任务在实际应用中仍存在限制。人脸检测方法仅仅能够检测人脸,这就意味着当人背对着摄像头时,该目标就会漏检;同时由于室内场景的复杂性,身体的大多数部位都是不可见的,所以行人检测的方法同样不可行。而人头检测就没有上述限制。在人头检测领域,虽然已经有相关团队基于传统图像处理方法及深度学习方法对其进行
学位
从海量的数据中挖掘出有价值的模式是非常重要的研究领域。数据挖掘的早期研究主要集中在频繁模式挖掘,目标是识别出在事务数据库中出现次数较多的项目集。这些频繁的模式能够帮助企业更好的理解数据并且提供决策支持。然而随着数据丰富度的增加,模式的频次信息不能满足工业界的应用需求,因此面对复杂的数据类型和多样的属性信息,许多基于频繁模式挖掘的拓展研究被相继提出。其中,高效用序列模式挖掘是近年来重要的研究领域之一
随着城市交通系统建设的快速发展,目前无人驾驶技术受到了越来越多的关注。如何保证高速行驶的无人车的安全性成为了无人驾驶技术的研究重点之一。场景深度推断和自运动检测作为无人驾驶技术的两个关键问题,对它们的深入研究将有助于无人驾驶技术安全性与可靠性的发展。目前激光雷达和GPS等传感器被广泛应用于场景深度推断和自运动检测问题研究,然而,它们普遍存在成本较高、对噪声和对人为干扰敏感等问题。随着照相机技术的快
驾驶事故是当今社会最严峻的问题之一,约九成驾驶事故是由于驾驶员行为不规范引起,利用准确高效的监管系统可有效降低事故发生概率。但现有系统面临诸多问题:使用机器学习方法提取特征,计算速度较慢,时效性较差;异常驾驶行为样本过少,难以训练有效分类模型;现有模型结构单一,分类精度差强人意。因此,设计精度高,速度快的驾驶员行为分类算法尤为重要。  针对以上问题,本文提出基于深度学习的驾驶员行为分类算法,利用目
学位
近年来,随着深度神经网络研究的推进,人工智能技术也迅猛发展,尤其是计算机视觉相关技术。通过计算机视觉技术可以模拟人类视觉功能辅助监控和生产,因此数十年来研究人员一直在进行相关任务的研究。人脸年龄估计作为计算机视觉的研究方向之一,在人机交互、法律条款推进、广告投放以及安防监控等方面有着重大的影响和良好的发展前景。  人脸年龄估计是通过对输入的人脸图像进行判断得到具体年龄的过程。人脸年龄估计系统的准确
学位
近些年,随着监控技术的快速发展,大量视频快速涌现,有效保障人们安全高效的工作生活。与此同时,这也急需对视频内容进行分析。通常来说,人体行为实例是视频的主体,而监控视频包含大量不包括人体行为的无用片段,因此需要快速定位视频中包含的每个行为实例片段,以便更好地对视频进行有效的理解与分析。传统的机器学习算法需要人工设计特征,计算复杂度高且泛化能力差,难以准确地对人体行为进行分析判断。因此,本文基于深度学