基于机器学习的多源信息股指涨跌预测研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:JERONG971
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金融领域中的股票市场不仅可以体现出我国经济发展的基本情况,而且牵动着众多投资者的心,因此股价趋势的有效预测对利益相关者来说具有重要的现实意义。现代信息技术的广泛应用使得资本市场投资者能够更及时的获得有价值的信息,同时也更容易受到论坛、专业投资网站的影响,本文融合了资本市场的多源异构数据对股票指数的涨跌进行预测,研究工作主要包含三个方面:第一,根据对股指预测相关研究成果的梳理,发现新的业界需求,明确研究目标。通过对传统股票市场投资理论及其影响因素的理论梳理,本文发现在大数据信息环境下,原有经典股票市场信息论正在受到巨大冲击。从个股股指,到宏观大盘,股票市场行情的走势越来越难以预测,丰富的信息源对整个市场的投资信心带来了更多不确定因素。面对这一挑战,本文进一步对现有股票预测相关研究进行了汇总。结合新的股票交易信息环境和文献研究结论,本文认为在现有的富数据环境下,大量个股的第三方文本信息可作为面对股指预测挑战的新突破口。第二,基于研究目标,探索研究路径,构建问题解决模型。尽管学界相信群体投资信心水平对股指有显著影响,但如何将现有富文本数据量化为反映投资信心的数据指标,当前研究鲜有涉及。首先针对研究目标,本文提出了一种基于多源异构数据的长短期神经网络(Long Short-Term Memory,LSTM)模型,用以完成对资本市场交易数据、技术指标数据、百度指数以及投资者情绪四种源数据的量化来预测股票指数的走势。其次,在量化“投资者情绪”的问题上,本文采用了一种可提取深度情感特征的卷积神经网络(Convolutional Neural Networks,CNN)情感分析模型。该模型利用CNN结合词向量对文本进行情感分析,可产出适用于LSTM网络的反映投资者情绪的量化数据特征。上述两个模型,构成了本文的问题解决方案主体。第三,收集实验数据,完成模型相关实验工作。为保证入模数据真实可靠,贴近投资实务,本文选择“上证50指数”作为研究对象,选用该指数的三年交易数据和各类技术指标作为直接数值型数据特征;编写爬虫程序截取对应交易期内“百度指数”和该类个股的“股吧”论坛数据作为投资者情绪类数据源,通过基于CNN的情感分析模型输出反映投资者情绪的量化数值型数据特征。在此基础上,使用基于LSTM的股指预测模型,完成相关实验工作,验证了模型的有效性和可靠性。本文为国内股指涨跌预测研究中的数据选取、数据处理和特征提取等方面提供一定的参考价值,对辅助交易决策具有重要的经济和社会价值。
其他文献
岩体的强度、变形、渗透性及破坏规律对水利工程、隧道工程、资源开采等工程的安全和稳定性有重大影响。岩体中存在天然的和人工生成的裂隙网络,且这些裂隙是粗糙的并具有分形的特征。由于基质和裂隙之间渗流能力的差异,流体主要通过复杂的裂隙网络进行运移。因此,研究复杂岩石裂隙网络的输运特性对地下油气资源的开采具有重要意义。本论文利用Weierstrass-Mandelbrot(W-M)分形函数和分形理论构建了不
学位
高速公路隧道的建设,缩短了运行距离,提高了高速公路的运输能力,在很大程度上节省了人们的出行时间。但是,由于隧道封闭狭长的空间结构特点,一旦在隧道内发生事故,造成的经济损失和人员伤亡远远大于普通路段。尤其是在引发火灾的情况下,产生的高温、有毒气体、烟雾不易排出,造成火灾附近的温度迅速上升,能见度极低,往往造成灾难性损失。因此,研究高速公路隧道火灾后的温度、有毒气体及烟雾变化规律和人员疏散过程具有重要
学位
医疗与国民健康息息相关,即便一个国家的经济与科技再发展,人们也免不了看病的问题。随着医疗产业化的推动,我们医疗卫生事业有了很大发展,但过度医疗的问题也随之出现。由于存在面广泛,且具有隐蔽难以被发现的特征,过度医疗给国民的健康带来很多危害,且为部分家庭造成严重的经济负担。就更广泛的社会层面而论,过度医疗问题的增多也引起医患矛盾的加大,有损于社会的稳定。立法者早已对过度医疗问题给予关注。早在2009年
学位
近年来,随着我国经济实力的增长,国家加大对交通基础设施的投资,隧道作为交通路网的重要组成部分,其数量的增加也是空前的。随着隧道建设工作的快速发展,其运营过程中所产生的病害问题也日趋严重,隧道的病害状况评价和养护管理工作开始得到高度重视。然而,我国对于隧道健康状况的评价方法仍然有一定的缺陷,同时我国关于公路隧道的养护管理工作与西方国家相比起步较晚,隧道的管理效率较低。因此,本文查阅国内外相关规范和文
学位
2018年我国银行业开启了开放银行模式的全新探索,其核心在于数据的开放共享,但掣肘于封闭的市场环境以及滞后的法律规范而发展缓慢,开放尚未及于金融数据。从比较法的角度来看,各国开放银行的建设都是建立在金融数据的开放之上,在法律架构上均确认了数据可携权作为开放银行的理论基础。2021年8月20日,历时多年的《中华人民共和国个人信息保护法》(简称《个保法》)出台,其中第四十五条在法律架构上规定了数据可携
学位
近年来,由于各个国家之间的贸易摩擦与利益纠纷,发达国家与发展中国家的关系日益紧张,全球贸易环境日趋动荡。现如今,每个国家在追求自身经济发展的同时,利用贸易政策来保护本国企业发展,为自身的发展创造出更为有利的贸易环境。我国在国际贸易中也会受到国际经济政治环境的影响,采取相应的贸易政策来扶持我国企业发展。例如中美贸易战中,面对美国政府对我国出口产品征收的高税率,我们也采取了相应提高关税的反制措施。而这
学位
传统热拌沥青混合料在施工过程中不仅会产生沥青烟气,还会因为温度过高消耗大量能源,不符合国家倡导的节能环保的要求。温拌技术能有效的降低施工温度、节约资源,而抑烟技术能有效的抑制沥青烟气的产生,减少环境的污染。因此,可以将温拌技术与抑烟技术相结合,制备温拌抑烟沥青混合料并对其路用性能进行检测,为沥青路面新型材料开辟一条新的道路。本文的研究内容大致如下:(1)通过自制沥青烟气收集装置,对沥青产烟规律及影
学位
《民法典》第134条的规定为公司瑕疵决议追认制度的构建提供了支撑,在该制度下,公司可以不借助司法途径,而是通过追认的方式对瑕疵决议进行救济。鉴于德国、美国等多个国家已经设立了较为完整的公司瑕疵决议追认制度,而且诉讼救济方式可能会产生较多的诉讼成本,这是不符合现代公司追求利益最大化的发展宗旨的,同时,也不利于公司内部自治与效率。然而,如何建立健全我国的瑕疵决议追制度,尚需进一步探讨。本文尝试对相关司
学位
《全面与进步跨太平洋战略经济伙伴协定(CPTPP)》于2018年在智利得以签署并生效,与其前身《跨太平洋战略经济伙伴协定(TPP)》相比,虽然CPTPP的经济规模和影响力小于TPP,但CPTPP仍然代表着区域贸易协定的较高标准。电信服务对国民经济的运作和国际贸易的便利化至关重要,它将企业和公民彼此联系起来,将国家与世界其他地区联系起来。信息和通信技术通过提供在线教育、电子政务和电子保健等服务,在改
学位
我国医疗保险覆盖范围日益扩大,但医疗保险欺诈案件频发,对医保基金造成了巨大损失。因此,有效识别医疗保险欺诈至关重要。传统的人工审核方式不仅成本巨大,且很难对医保欺诈案件进行准确、高效地识别。与传统方法相比,机器学习不仅能节约大量人力和时间成本,且识别准确率高,为医保欺诈识别提供了技术支持。但现有医保欺诈识别研究中对诊疗文本数据挖掘还不够充分,丢失了大量关键信息,从而影响了欺诈识别的效果。而知识图谱
学位