融入概念相似度的计算动词决策树分类算法研究及其在期货市场的应用

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:naimiu2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着零售业的联机事务处理、金融市场及传感器网络等发展,存在着大量的快速变化的、潜在无限的数据流。而在这些数据流中往往存在着大量有用的知识,因而如何从数据流中挖掘出这些未知但又有价值的信息,从而指导人们做出决策,是当前数据挖掘领域所面临的热点和难点之一。特别是针对隐含有概念漂移的数据流,如何研究出一种能够适应概念漂移数据流的分类方法,并对周期性出现的概念能够更有效地处理,是本文的研究重点。与此同时,期货市场是一个非常复杂的非线性的动态时间序列系统,它传递的价格信息是对未来供求状况的预期。因此,对期货市场进行价格趋势的预测,对于国民经济的发展,政府进行市场监管,投资者投资净效用最大化等方面都有极其重要的意义。正是基于此,本文提出了融入概念相似度的计算动词决策树分类算法,该算法不仅引入计算动词概念,使得生成的决策树具有动态预测效果,还能够针对数据流中出现的概念进行存储,再一次出现时通过相似度计算进行历史概念匹配和查找,用相似度较高的一个或几个历史概念对应的分类器对其进行分类,大大加快了分类速度,更能够适应期货市场实时预本文首先阐述了数据挖掘背景以及期货市场量化投资的相关研究基础,指明在期货市场量化投资的策略上,应用数据挖掘相关知识能够达到较好的效果。然后简单的介绍了数据挖掘中隐含概念漂移的数据流分类算法,及期货市场量化投资现有的相关研究方法。其次,本文研究了融入概念相似度的隐含概念漂移的决策树分类算法。该算法通过概念的定义计算概念之间相似度,对相似度高的新概念免去学习过程直接用历史概念的分类器对其进行分类。同时介绍了计算动词决策树算法,通过引入计算动词概念,使得新的决策树能够体现动态变化过程。最后,本文结合上述两种算法研究一种新的融入概念相似度的计算动词决策树分类算法,首先对数据库进行动词化,然后当检测到数据流发生概念漂移时,算法并非直接对当前数据流进行训练得到新的分类模型,而是先对当前数据(概念外延)进行相似度检验,查找相似度高的概念内涵或者较高的概念内涵,使用高相似度概念内涵对应的分类器或者较高概念内涵对应的分类器组合对当前数据进行分类预测,使得算法在分类效率及准确率上大大提高。因此该算法包含上述两种算法的优点,最后本文通过期货市场的实证分析,在期货市场的投资收益率来体现算法的有效性。
其他文献
于漪老师说,我一走上讲台,生命就开始歌唱。  这是语文教学最为精彩、最为神圣的时刻。  这是语文教师最真诚、最美好、“最教育”的状态。  语文教学就是生命的歌唱,是教师与学生的合唱,领唱者是教师,但有时也会是学生。  如果给这首生命之歌取个名字的话,叫作:用语文来育人,让人来创造语文。这名字其实是语文教学的宗旨与境景,是语文教学改革的主旋律,是每个语文教师心中的歌。  一、生命的歌唱:语文教学的意
期刊
随着全球贸易的一体化,配置的全球化,顾客需求的多样化,企业间的竞争越来越激烈,尤其是在制造领域,在这种环境下,企业为了生存并且在竞争中取得一定的话语权,越来越重视对于生产的管理。流水车间是现如今企业采用最为广泛的生产作业形式,对其研究对企业的生产具有重要的意义。流水车间调度的主要目标便是根据企业的实际生产状况,合理的安排生产,使企业能够达到所设定的目标,实现利润的最大化。通过研究得知流水车间调度问
城市群是各国参与全球竞争和国际分工的全新地域单元,也是我国经济建设不容忽视的一部分。城市群经济发展已成为近年来研究的热门问题,但研究多从城市规划、区域规划等城市群空
物联网(Internet of Things),即“物物互联的网络”,是世界信息产业革命的第三次浪潮。物联网情境下用户隐私处于“被暴露”状态导致信息安全缺乏保障和传统隐私概念被模糊化
一直以来,基于语文学科学生思维能力的发展和训练,都是滞后和薄弱的.但是近几年,不少专家学者已深入语文思维可视的研究领域,或撰述思维可视化对语文核心素养发展的理性认识,
期刊
国际金融危机已经进入第五个年头,欧元区主权债务危机仍在发酵,世界经济呈现增长乏力,金融市场的风险不断加大。为了有效地规避金融市场风险,转移价格风险和信用风险,投资者可以利