一种新型基于多信源的股价趋势预测方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:banlangen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票价格及趋势预测是金融智能研究的热门话题。各种各样的信息源用于股价预测,例如基本经济特征、技术指标、网络舆情、财务公告、财政新闻、金融研报等等。显然,更多的来源带来更多的信息。然而,大部分的以前的研究只在它们的预测模型中使用一种或两种信息源。这是因为不同的数据源会给股票市场带来不同的影响,并且识别不同的信源之间的相关性相当困难。再者,更多信源的使用将会增加遭受维度灾难的风险。但是,股票市场错综复杂,灵活多变,没有单独的一种信源可以完全反映股票市场的信息。为此,本文提出了一种新型的基于多信源的股价趋势预测方法。这个方法使用三种不同的信源来预测股价趋势,三种信源分别是基本经济特征,技术指标以及网络舆情。多信源股价趋势预测方法首次把多个信源数据,机器学习以及文本情感分析技术运用到股价趋势预测上,这个方法包含三个步骤。首先,收集多信息源的数据。然后,进行数据的预处理,把多信源的数据统一到一个数据集中,这是多信源股价趋势预测方法的关键步骤,该步骤中使用到了文本情感分析技术,在这个过程中,本文提出了一个针对金融领域的极性情感词典,该极性情感词典在对网络舆情数据进行情感倾向评分时起到了重要的作用,该极性情感词典也是本文的创新工作之一。最后,使用支持向量机分类器构造预测模型。为了体现本文提出的多信源股价趋势预测方法的性能,本文根据不同的输入信源组合设置对比实验,实验结果表明,我们的模型效果比只用一个信源的模型或者使用两个信源的模型效果要好。此外,我们获得有趣的发现。例如,提取的原始网络舆情的数量在非交易日内大幅上涨。因此,我们可以通过增加对非交易日舆情数据的情感分析提高预测的准确率,为了验证这个理论,我们根据是否考虑非交易日舆情数据的影响,设置对比实验,实验结果表明增加对非交易日舆情数据的情感分析可以提高预测的性能。本文的实验结果表明尽管融合多信源数据有困难,通过适当的预处理和特征选取,仍然可以获得一个好的预测器。
其他文献
学位
模型检验是一种重要的自动化验证技术,在保障软件高可信性过程中发挥着巨大作用。近年来分布式系统的发展表明,模型检验中的公平性问题已经引起了诸多关注。如果不考虑公平性,模
随着经济发展和时间推移,越来越多的自然山体和人造山体(渣土堆)发生滑坡。滑坡既是一种自然现象,但同时也很大程度上由于人类的各种开发和活动影响。一旦发生山体滑坡,将会极大
学位
我国铁路建设对重轨的生产质量有着非常严格的要求,而在重轨生产的环节中,重轨的孔型设计又占有非常重要的地位,它决定了重轨产品的几何形状、生产精度、设计效率,同时对产品的安
天文学研究领域中,由于观测仪器设备的跨地域分布和多学科交叉等因素,使得天文研究人员工作地区相对分散,而对于天文数据的处理和研究工作需要各个地域不同部门之间的协同合
在计算机辅助几何设计中,经常会要求构造一条插值曲线(或插值曲面),顺序插值给定的数据点。插值曲线(曲面)的形状既会受到所选插值方法的影响,也会受到所选数据点参数化方法
航天嵌入式软件是面向航天领域的特殊的嵌入式软件,它的可靠性和健壮性直接关系到航天飞行器的安全。如果没有对软件进行充分的调试和验证,一旦出现问题,不仅能造成飞行器的损毁
在计算机辅助几何设计中,参数曲线曲面造型方法被广泛的运用于几何造型工业中,其中带形状参数的Bézier(贝齐尔)曲线的扩展是广大学者们研究的热点问题之一。随着曲线几何造型中
手语识别的实现能够方便健听人和听障人之间的沟通,同时手语识别技术的提升也有助于人机交互技术的发展,因此手语识别的研究有着重要的意义。目前,基于视觉的手语识别普遍存在着