论文部分内容阅读
内幕操纵行为严重破坏了市场公平的投资秩序,损害了中小投资者的利益,而且加剧了股价的异常波动,但是其行为往往非常隐蔽而难以甄别。本文以数据挖掘为基础,系统研究市场微观结构,从上市公司二级市场交易数据中提取Beta值、流动性、自相关性、信息含量甄别因子,系统研究了数据挖掘方法在内幕操纵行为甄别中的应用。本文首先对内幕操纵行为进行经济学分析,然后建立相应的甄别指标体系,在传统判别方法Logistic回归模型之外,本文引入决策树模型和人工神经元网络模型,按照数据挖掘的流程建立并研究内幕操纵行为甄别体系。在模型一致性和稳定性方面,本文利用训练样本集和测试样本集对各种模型的识别结果进行比较。研究结果表明,在拟合训练样本集上,Logistic模型、决策树模型、人工神经元网络模型都具有很高的识别率,而在测试样本集的识别上,模型之间表现出一定的稳定性。