论文部分内容阅读
相关性分析涉及到人类活动的各个领域,包括自然科学、社会生活、金融市场、医学研究等等,一直以来都是数据探索的研究热点。在当今的大数据时代,数据量的庞大和数据特征的多样化给相关性分析带来了挑战,但同时也给了发现非直观变量之间可能存在相关关系的机会。本文从三个方面考虑相关关系刻画方法的优点和不足,探索合适的分析方法,挖掘变量之间的非线性相关关系,以合理的方式完整的刻画变量之间的相关性以及解释其传导机制,并在美元指数及其可能的影响因素数据上进行了实证分析。
首先,本文综合中美贸易战的经济形势,选取了美元指数和人民币汇率两个变量,通过计算其统计相关系数值,探讨美元指数与人民币汇率之间的相关程度。研究结果发现,美元指数与人民币汇率之间的统计相关系数约为0.538,而美元指数的自相关系数不超过0.150,且贸易战后的相关程度大于贸易战前。这说明相关性是存在的,但是线性相关程度不高,只依赖于线性模型的统计相关系数并没有完整的刻画变量之间的相关关系。
其次,为了探究美元指数与人民币汇率之间的其他相关关系,本文计算了其概率相关系数,对比结果发现:两者概率相关性中同向概率约0.705,大于统计相关性的计算结果;美元指数的概率自相关性与统计自相关性存在着明显差异,不仅仅体现在数值大小上,而且在正负方向上也有所不同。通过量化计算,本文认为统计相关系数仅仅刻画了线性相关关系,而概率相关系数可以刻画其非线性相关关系,其中贸易战后美元指数和人民币汇率的相关性大于贸易战前,且贸易战对两者相关关系影响主要体现在线性相关上。但统计相关系数和概率相关系数都不能说明美元指数与人民币汇率之间相关关系的传导机制。
最后,为解决传导机制问题,本文建立了路径相关模型,并扩展为路径间接相关模型。由于美元指数计算公式中每个汇率对应一个常系数,考虑到汇率是实时变化的,本文建立的路径相关模型将这些常系数用一种非线性模型进行拟合,设计时变的系数和模型误差,来反映真实数据当日的变动情况。通过在非线性部分增加单个或多个变量的方式,从不同的时间角度,分析线性和非线性变量与因变量的直接和间接相关关系。研究结果发现,路径相关性模型可以解释多个变量之间的线性相关、非线性相关关系,以及每个变量或者多个组合变量的相关性的传导机制。
首先,本文综合中美贸易战的经济形势,选取了美元指数和人民币汇率两个变量,通过计算其统计相关系数值,探讨美元指数与人民币汇率之间的相关程度。研究结果发现,美元指数与人民币汇率之间的统计相关系数约为0.538,而美元指数的自相关系数不超过0.150,且贸易战后的相关程度大于贸易战前。这说明相关性是存在的,但是线性相关程度不高,只依赖于线性模型的统计相关系数并没有完整的刻画变量之间的相关关系。
其次,为了探究美元指数与人民币汇率之间的其他相关关系,本文计算了其概率相关系数,对比结果发现:两者概率相关性中同向概率约0.705,大于统计相关性的计算结果;美元指数的概率自相关性与统计自相关性存在着明显差异,不仅仅体现在数值大小上,而且在正负方向上也有所不同。通过量化计算,本文认为统计相关系数仅仅刻画了线性相关关系,而概率相关系数可以刻画其非线性相关关系,其中贸易战后美元指数和人民币汇率的相关性大于贸易战前,且贸易战对两者相关关系影响主要体现在线性相关上。但统计相关系数和概率相关系数都不能说明美元指数与人民币汇率之间相关关系的传导机制。
最后,为解决传导机制问题,本文建立了路径相关模型,并扩展为路径间接相关模型。由于美元指数计算公式中每个汇率对应一个常系数,考虑到汇率是实时变化的,本文建立的路径相关模型将这些常系数用一种非线性模型进行拟合,设计时变的系数和模型误差,来反映真实数据当日的变动情况。通过在非线性部分增加单个或多个变量的方式,从不同的时间角度,分析线性和非线性变量与因变量的直接和间接相关关系。研究结果发现,路径相关性模型可以解释多个变量之间的线性相关、非线性相关关系,以及每个变量或者多个组合变量的相关性的传导机制。