数据挖掘的若干新方法及其在我国证券市场中应用

被引量 : 0次 | 上传用户:S82415127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是信息领域发展最快的技术,很多不同领域的专家,比如统计学家、数据库专家等,都从中获得了发展的空间,使得数据挖掘日益成为企业界讨论的热门话题。随着信息技术的发展,人们采集数据的手段日益丰富与高明,由此积累的数据日益膨胀,数据量达到GB 甚至TB 级,而且高维数据也日益成为主流。这些海量数据及其高维特征使得传统的数据分析手段相形见绌。计算机性能的日益更新,使得人们能够期望计算机帮助我们分析与理解数据,帮助我们以丰富的数据为基础做出正确决策。数理统计是应用数学中最重要、最活跃的学科之一,它在计算机发明之前就诞生了,迄今已有几百年的发展历史。如今相当强大有效的数理统计方法和工具,已成为信息咨询业的基础。信息时代,咨询业更为发达。然而,数理统计和数据库技术结合得并不算快,数据库查询语言SQL 中的聚合函数功能极其简单,就是一个证明。咨询业用数据库查询数据还远远不够。一旦人们有了从数据查询到知识发现、从数据演绎到数据归纳的要求,概率论和数理统计就获得了新的生命力,所以才会在DM 这个结合点上,立即呈现出“忽如一夜春风来,千树万树梨花开”的繁荣景象。一向以数理统计工具和可视化计算闻名的美国SAS 公司,领先宣布进入DM 行列真正所说明这一点。因此有必要将更多的统计学的知识应用到数据挖掘领域中来,使得DM 得到更充分的发展,使统计学的应用价值得到更充分的体现。本文主要是探索一些可操作性强、实时性的统计挖掘方法,并应用到沪、深股市的研究中,得到了非常好的效果。这种不同于静态分析的方法对我们面临的大量数据能够非常及时的作出分析、判断。第一章介绍了数据挖掘的一些相关概念、基础知识以及国内外的发展现状。第二章我们应用一些非常成熟的方法,在闫冀楠[1]的基础上对沪、深股市作了进一步分析,给出了我国股票市场运行并非完全有效的有力论断,为后面的工作提供基本前提。第三章应用线性模型的相关理论,提出了新的检验创新异常点的方法,并在我国证券市场进行实证分析,获得较好的结果。第四章应用异常诊断中一些常用距离方法(Cook 距离法、似然距离法),并在此基础上给出了一种新的Cook 距离,在证券实证分析中挖掘出效率很高的“线
其他文献
信息产品的高固定成本、低边际成本的特殊成本结构使信息产品具有巨大的供方规模经济性;而信息产品的网络外部性又使信息产品具有需方规模经济性。信息产品的这些特性给其定
全桥气动弹性模型是研究大跨桥梁风致振动性能的重要手段。为确保气动弹性模型试验结果能真实反应实际桥梁结构在大气边界层的风振响应,全桥气弹模型需要在满足模型与原型气动
通过查阅相关国内外文献资料,掌握了砂砾石混合料的研究情况及动态,并通过大量的室内试验分析与理论研究,确定出砂砾石、粘土组成的混合料基本的力学参数;混合料压缩、固结机理、
雷电是自然界常见的一种自然现象,发生时各类电子电气设备容易被破坏,本文对中波发射台的防雷方案做一简要介绍。
<正>目的探讨临床孤立综合征合并焦虑抑郁情况方法本临床研究在莆田学院附属医院神经内科完成。比较临床孤立综合征与正常健康人群(对照组)焦虑抑郁评分,分析焦虑抑郁障碍在
会议
介绍成都万达茂水雪乐园项目钢屋盖连续大跨度三角管桁架利用BIM三维软件进行模拟预拼装技术,缩短加工周期,保证加工精度,确保现场一次拼装合格,多家单位可以联机预拼装,提高
本文介绍了常用的九种基于Web页面的动态技术,讨论了它们的特点和性能,并对这些技术作了比较.
目的探讨不同放疗方案对宫颈癌根治术后复发伴转移患者的近远期疗效,并分析其预后影响因素。方法对2013年3月—2015年6月96例宫颈癌根治术后复发伴转移患者的临床资料进行回
本课题建设了一个新型的数字校园网,首先对校园网建设的背景和意义进行了阐述;其次结合校园网建设背景对校园网整体进行了规划,包括校园网管理平台、共享数据中心和校园网络,
随着桥梁工程的不断发展和进步,大跨度混合梁斜拉桥以其合理的力学性能和良好的经济性得到了越来越广泛的应用。本文以江西九江长江公路大桥为工程背景,首先简要介绍了混合梁