论文部分内容阅读
【摘 要】论文讲述了如何利用Python对多只股票进行数据分析,并且分析每只股票间的异同。运用Python,可将股票数据进行可视化处理,例如,运用线性图展现出股票随时间的变化情况;利用烛状图了解每只股票每日闭市与开市相比的盈利或者亏损情况;利用移动平均值直观地观察在规定时间内股票价格变动,了解股票价格是否稳定。论文以制定更好的决策为目的,从数据可视化入手,提供优质有效的数据信息,运用数据挖掘技术对微软、苹果、谷歌等多只股票价格波动趋势进行研究。
【Abstract】The paper describes how to use Python to analyze data on multiple stocks and analyze the similarities and differences between each stock. By using Python, the stock data can be visualized. For example, using a linear charting to show the changing situation of the stock over time. Using candlestick charting to understand the profit or loss situation of each stock when the market is closed compared to the open each day. Using moving averages to visually observe the stock price changes within a specified period of time to understand whether the stock price is stable. With the aim of making better decisions, the paper starts with data visualization to provide high-quality and effective data information, and uses data mining technology to study the price fluctuation trends of several stocks such as Microsoft, Apple and Google.
【关键词】移动平均;烛状图;股票数据
【Keywords】moving average; candlestick charting; stock data
【中图分类号】F831.5 【文獻标志码】A 【文章编号】1673-1069(2021)01-0111-03
1 引言
在21世纪,股票已经成为经济领域的重头戏,股票价格数据的变化直接影响的是股票市场,而股票市场的稳定程度可以从一定程度反映一个国家的经济状态。进行股票数据分析则有利于更好地去观察股票数据的变化趋势,将它们从多角度进行可视化处理,以客观的角度观察某只或一些股票价格的变化情况。
本文利用Python对苹果、微软、谷歌三只股票进行分析:其中,以线段的方式将股票自2019年1月1日至2019年7月8日的股票数据进行可视化,更加清晰地了解到股票的变化情况。以烛状图的方式展现每只股票当日的亏损与盈利,根据图中的所展示烛身形状、颜色及位置,可以作出更准确的判断。运用移动平均值来体现股票在某时间段内的变化波动,为大部分依靠图表信息而作出判断的交易人提供有效的数据,使一系列杂乱的数据信息以更清晰明了的方式展现出来……本文的目的是让人们清晰地观察各个公司股票价格的数据变化,为人们提供每个公司股票价格数据中蕴含的有效信息,根据其变化趋势作出正确的决策。
本文第二部分根据已有结论验证了探究学习股票数据分析方法的必要性。第三部分运用Python爬虫工具包分析苹果公司2019年1月1日至2019年7月8日的股票价格信息,以线性图的方式展现了其价格变动趋势。同时,介绍移动平均值,了解移动平均值在股票处理上的作用。第四部分根据所介绍的方法结合相关数据绘制图像,分析每只股票的异同,观察股票在不同天数的移动平均下,价格波动的不同。第五部分明确文章的目的,明确数据挖掘技术对股票数据分析的影响。
2 文献综述
随着科技的发展,人们已经进入了信息化时代,高效的数据挖掘技术是做股票数据分析的重要途径,将数据可视化处理,更有利于观察其变化情况,刘小燕[1]在《基于图像处理方法的股票数据分析研究》中提到:对板块内的所有股票数据间的研究,有利于在了解板块整体的涨跌情况以及板块内是否存有涨势情况异于其他的股票后,为投资者对该板块的后期发展的分析提供一些参考信息。
在可视化处理中,运用合理有效的方法对于分析数据有着重要的作用。例如,烛状图,刘哲、王虎、杨建宇等人[2]在《品种筛选多环境测试作图分析方法》中提到:蜡烛图有助于单指标的详细对比和规律挖掘,如试点区辨力、品种稳定性与优异性规律等。 除烛状图外,人们还运用到了移动平均值的方法,刘丽芳、王慧、王松敏等人[3]在《移动平均法在青少年吸毒分析中的应用》中提到:移动平均法是一种时间序列预测法,它是能从时间序列数据中去掉周期变动或随机波动的影响,从而进行数据分析的方法。
3 股票数据收集与移动平均值介绍
3.1 股票数据收集
运用合理的收集方法是进行有效数据收集的必要前提,因此,本文数据收集过程采用了Python中data工具包的DataReader,这里将苹果公司的股票信息从Yahoo上收集下来,提取自2019年1月1日至2019年7月8日的股票数据进行数据分析(见图1)。
在数据分析过程中,open指的是每一天开盘时股票的价格,这里的股票价格指的并不是前一天闭市时股票的价格;close指的是每一天闭盘时股票的价格,同理这里的价格也不是第二天开盘时股票的价格;high指的是每一天股票价格的最高值;low指的是每一天中股票价格的最低值;volume指的是一天股票的交易次数;adjust close指的是根据法人进行操作过后的闭市价格。股票价格大部分情况是由交易者决定的,但stock splits(拆股,也就是上市公司将现有的股票分为两份,新的股市价格为原来价格的二分之一)和dividends(分红,每一股的分红)都会影响当天股票的价格。这里每一个因素都应该进行处理分析,以便于得到更清晰、更准确的股票数据信息,使人们更好地作出判断。
3.2 移动平均值
除了根据数据分析中图表的方式作出决策以外,人们还可以利用移动平均值来找到股票价格的变化趋势,从而用具体的数据反映股票真实的变化情况。
移动平均值可以让某些杂乱的连续数据变得更加平滑,这利于人们从中找到股票数据信息的变化情况。例如,将一个q天的移动平均值(用MA■■来表示)定义为:对于某一个时间点t,它之前q天的平均值。
其中,q值越大,其波动越不敏感,越平滑。越快的移动平均,q值越小,其展现的图像更贴合真实的股票价格变动;而越慢的移动平均,它的q值越大,这让其对波动不敏感并且逐渐变得更加稳定。
4 实证分析
利用上述方法,本文将收集到的股票价格数据信息进行了可视化处理,在这里分别以“股票趋势变化”与“股票烛状图及移动平均值”两部分向大家展示。
4.1 股票趋势变化
每只股票的利益是每个交易者所关注的,所以本文将每天的股票价格与第一天初始价格做差值,进行可视化。将苹果公司、微软公司以及谷歌公司自2019年1月至2019年8月每日股票数据的变化量绘制出来,如图2所示,在图中可以清楚地看出几只股票自数据第一天起,每日的股票价格与首日的股票价格相比的收益差距有着明显的不同。
其中,蓝色的线代表苹果公司的股票,从图上可以看到,这只股票在这近几个月里股票价格波动幅度较大,股票的价格不稳定;绿色的线代表谷歌公司的股票,它与第一天的股票价格相比,收益差距趋势近似于苹果公司,同样也是波动幅度较大,股票的价格不稳定;最后黄色的线代表微软公司的股票,其较其他两只股票的图像相比,其线段的最大值与最小值差距比较小,波动不太明显,更为稳定。
除了用线段的方法展示数据信息以外,还可以利用烛状图的方式将股票数据信息进行可视化处理,从而以不同的角度观察探究股票的价格变动。
4.2 股票烛状图及移动平均值
利用烛状图可以清楚看出股票在所研究时间段内每天的数据增减比例。如图3展示的是苹果公司自1月7日至7月8日每天的股票价格变化图。其中,每个红色部分代表当天闭市价格高于开市的价格(盈利),每个黑色部分代表闭市价格低于开市的价格(亏损),根据图中所展示的烛身形状、颜色及位置,可以作出更准确的决策。
在交易过程中,绝大部分的交易者仅仅是利用图表来作出判断,所以本文运用到了移动平均值。利用函数,将苹果公司股票价格的20天移动平均值与50天移动平均值表示出来,如图3所示,蓝线代表的是20天的移动平均值,红线代表的是50天的移动平均值。将两个移动平均值相比,50天具有较慢的移动平均,其波动较20天波动来说,更为稳定。但移动平均值的开始时间与所选择的天数有关,多少天的移动平均值,它的开始时间就推迟多少天,这对长时间段的移动平均值有着较大的影响。
5 结语
利用数据挖掘技术对股票数据进行处理有利于更好地观察每只股票的波动趋势,更容易地观察出股票因时间因素而形成的变化趋势。运用Python,将多只股票的数据信息分别以线性图、烛状图的方法进行可视化处理,分析图像,了解如何利用图像观察股票在近几个月的价格变化情况和每只股票每日闭市与开市相比的盈利或者亏损,比较多只股票的价格波动趋勢。了解移动平均值,明确移动平均值在股票数据分析中的优势,观察图像,比较不同时间的移动平均对图像信息的影响。运用多种可视化处理的方法,正确分析股票数据信息,提供优质有效的数据信息,以便于交易者作出准确的决策,促进股票市场经济的发展。
【参考文献】
【1】刘小燕.基于图像处理方法的股票数据分析研究[D].重庆:重庆大学,2013.
【2】刘哲,王虎,杨建宇,等.品种筛选多环境测试作图分析方法[J].农业工程学报,2011,27(10):142-147.
【3】刘丽芳,王慧,王松敏,等.移动平均法在青少年吸毒分析中的应用[J].咸阳师范学院学报,2015,30(04):37-40.
【Abstract】The paper describes how to use Python to analyze data on multiple stocks and analyze the similarities and differences between each stock. By using Python, the stock data can be visualized. For example, using a linear charting to show the changing situation of the stock over time. Using candlestick charting to understand the profit or loss situation of each stock when the market is closed compared to the open each day. Using moving averages to visually observe the stock price changes within a specified period of time to understand whether the stock price is stable. With the aim of making better decisions, the paper starts with data visualization to provide high-quality and effective data information, and uses data mining technology to study the price fluctuation trends of several stocks such as Microsoft, Apple and Google.
【关键词】移动平均;烛状图;股票数据
【Keywords】moving average; candlestick charting; stock data
【中图分类号】F831.5 【文獻标志码】A 【文章编号】1673-1069(2021)01-0111-03
1 引言
在21世纪,股票已经成为经济领域的重头戏,股票价格数据的变化直接影响的是股票市场,而股票市场的稳定程度可以从一定程度反映一个国家的经济状态。进行股票数据分析则有利于更好地去观察股票数据的变化趋势,将它们从多角度进行可视化处理,以客观的角度观察某只或一些股票价格的变化情况。
本文利用Python对苹果、微软、谷歌三只股票进行分析:其中,以线段的方式将股票自2019年1月1日至2019年7月8日的股票数据进行可视化,更加清晰地了解到股票的变化情况。以烛状图的方式展现每只股票当日的亏损与盈利,根据图中的所展示烛身形状、颜色及位置,可以作出更准确的判断。运用移动平均值来体现股票在某时间段内的变化波动,为大部分依靠图表信息而作出判断的交易人提供有效的数据,使一系列杂乱的数据信息以更清晰明了的方式展现出来……本文的目的是让人们清晰地观察各个公司股票价格的数据变化,为人们提供每个公司股票价格数据中蕴含的有效信息,根据其变化趋势作出正确的决策。
本文第二部分根据已有结论验证了探究学习股票数据分析方法的必要性。第三部分运用Python爬虫工具包分析苹果公司2019年1月1日至2019年7月8日的股票价格信息,以线性图的方式展现了其价格变动趋势。同时,介绍移动平均值,了解移动平均值在股票处理上的作用。第四部分根据所介绍的方法结合相关数据绘制图像,分析每只股票的异同,观察股票在不同天数的移动平均下,价格波动的不同。第五部分明确文章的目的,明确数据挖掘技术对股票数据分析的影响。
2 文献综述
随着科技的发展,人们已经进入了信息化时代,高效的数据挖掘技术是做股票数据分析的重要途径,将数据可视化处理,更有利于观察其变化情况,刘小燕[1]在《基于图像处理方法的股票数据分析研究》中提到:对板块内的所有股票数据间的研究,有利于在了解板块整体的涨跌情况以及板块内是否存有涨势情况异于其他的股票后,为投资者对该板块的后期发展的分析提供一些参考信息。
在可视化处理中,运用合理有效的方法对于分析数据有着重要的作用。例如,烛状图,刘哲、王虎、杨建宇等人[2]在《品种筛选多环境测试作图分析方法》中提到:蜡烛图有助于单指标的详细对比和规律挖掘,如试点区辨力、品种稳定性与优异性规律等。 除烛状图外,人们还运用到了移动平均值的方法,刘丽芳、王慧、王松敏等人[3]在《移动平均法在青少年吸毒分析中的应用》中提到:移动平均法是一种时间序列预测法,它是能从时间序列数据中去掉周期变动或随机波动的影响,从而进行数据分析的方法。
3 股票数据收集与移动平均值介绍
3.1 股票数据收集
运用合理的收集方法是进行有效数据收集的必要前提,因此,本文数据收集过程采用了Python中data工具包的DataReader,这里将苹果公司的股票信息从Yahoo上收集下来,提取自2019年1月1日至2019年7月8日的股票数据进行数据分析(见图1)。
在数据分析过程中,open指的是每一天开盘时股票的价格,这里的股票价格指的并不是前一天闭市时股票的价格;close指的是每一天闭盘时股票的价格,同理这里的价格也不是第二天开盘时股票的价格;high指的是每一天股票价格的最高值;low指的是每一天中股票价格的最低值;volume指的是一天股票的交易次数;adjust close指的是根据法人进行操作过后的闭市价格。股票价格大部分情况是由交易者决定的,但stock splits(拆股,也就是上市公司将现有的股票分为两份,新的股市价格为原来价格的二分之一)和dividends(分红,每一股的分红)都会影响当天股票的价格。这里每一个因素都应该进行处理分析,以便于得到更清晰、更准确的股票数据信息,使人们更好地作出判断。
3.2 移动平均值
除了根据数据分析中图表的方式作出决策以外,人们还可以利用移动平均值来找到股票价格的变化趋势,从而用具体的数据反映股票真实的变化情况。
移动平均值可以让某些杂乱的连续数据变得更加平滑,这利于人们从中找到股票数据信息的变化情况。例如,将一个q天的移动平均值(用MA■■来表示)定义为:对于某一个时间点t,它之前q天的平均值。
其中,q值越大,其波动越不敏感,越平滑。越快的移动平均,q值越小,其展现的图像更贴合真实的股票价格变动;而越慢的移动平均,它的q值越大,这让其对波动不敏感并且逐渐变得更加稳定。
4 实证分析
利用上述方法,本文将收集到的股票价格数据信息进行了可视化处理,在这里分别以“股票趋势变化”与“股票烛状图及移动平均值”两部分向大家展示。
4.1 股票趋势变化
每只股票的利益是每个交易者所关注的,所以本文将每天的股票价格与第一天初始价格做差值,进行可视化。将苹果公司、微软公司以及谷歌公司自2019年1月至2019年8月每日股票数据的变化量绘制出来,如图2所示,在图中可以清楚地看出几只股票自数据第一天起,每日的股票价格与首日的股票价格相比的收益差距有着明显的不同。
其中,蓝色的线代表苹果公司的股票,从图上可以看到,这只股票在这近几个月里股票价格波动幅度较大,股票的价格不稳定;绿色的线代表谷歌公司的股票,它与第一天的股票价格相比,收益差距趋势近似于苹果公司,同样也是波动幅度较大,股票的价格不稳定;最后黄色的线代表微软公司的股票,其较其他两只股票的图像相比,其线段的最大值与最小值差距比较小,波动不太明显,更为稳定。
除了用线段的方法展示数据信息以外,还可以利用烛状图的方式将股票数据信息进行可视化处理,从而以不同的角度观察探究股票的价格变动。
4.2 股票烛状图及移动平均值
利用烛状图可以清楚看出股票在所研究时间段内每天的数据增减比例。如图3展示的是苹果公司自1月7日至7月8日每天的股票价格变化图。其中,每个红色部分代表当天闭市价格高于开市的价格(盈利),每个黑色部分代表闭市价格低于开市的价格(亏损),根据图中所展示的烛身形状、颜色及位置,可以作出更准确的决策。
在交易过程中,绝大部分的交易者仅仅是利用图表来作出判断,所以本文运用到了移动平均值。利用函数,将苹果公司股票价格的20天移动平均值与50天移动平均值表示出来,如图3所示,蓝线代表的是20天的移动平均值,红线代表的是50天的移动平均值。将两个移动平均值相比,50天具有较慢的移动平均,其波动较20天波动来说,更为稳定。但移动平均值的开始时间与所选择的天数有关,多少天的移动平均值,它的开始时间就推迟多少天,这对长时间段的移动平均值有着较大的影响。
5 结语
利用数据挖掘技术对股票数据进行处理有利于更好地观察每只股票的波动趋势,更容易地观察出股票因时间因素而形成的变化趋势。运用Python,将多只股票的数据信息分别以线性图、烛状图的方法进行可视化处理,分析图像,了解如何利用图像观察股票在近几个月的价格变化情况和每只股票每日闭市与开市相比的盈利或者亏损,比较多只股票的价格波动趋勢。了解移动平均值,明确移动平均值在股票数据分析中的优势,观察图像,比较不同时间的移动平均对图像信息的影响。运用多种可视化处理的方法,正确分析股票数据信息,提供优质有效的数据信息,以便于交易者作出准确的决策,促进股票市场经济的发展。
【参考文献】
【1】刘小燕.基于图像处理方法的股票数据分析研究[D].重庆:重庆大学,2013.
【2】刘哲,王虎,杨建宇,等.品种筛选多环境测试作图分析方法[J].农业工程学报,2011,27(10):142-147.
【3】刘丽芳,王慧,王松敏,等.移动平均法在青少年吸毒分析中的应用[J].咸阳师范学院学报,2015,30(04):37-40.