论文部分内容阅读
本文针对上市公司的财务报表数据进行分析,以人工智能的吉布斯随机搜索(Gibbs Sampling)算法为工具,建立在大数据框架下筛选描述公司财务欺诈风险特征因子的一般处理方法与实施原理,并结合真实的非结构化坏样本进行实证分析。根据我国2018年A股上市公司财务报表构建支持财务欺诈风险的初始特征因子集合为出发点,结合从17年1月到18年12月证监会对上市公司财务报表信息披露违规的数据样本为基础样本,挖掘可描述"财务欺诈风险"的特征进行监督学习,然后筛选出可刻画财务欺诈的特征因子:即,通过解决由于财务报表勾稽关系(通过财务报表科目的两两交互项)而产生的高维数灾难问题,从财务报表数据以及各财务数据的两两交互项中提取出为数不多的8个关联的特征因子来刻画上市公司的财务欺诈风险,分别是:"扣非净资产收益率;在建工程增长率;预付款项增长率;利息费用(财务费用)/营业总收入;投资净收益/营业总收入;其他收益/营业总收入;其他应收款(含利息和股利)/总资产;长期借款/总资产"。结合刻画财务欺诈特征指标的比值比(Odds Ratio)作为验证标准和特征指标对应的会计含义,发现这些指标与财务欺诈所在公司的会计政策选择、公司治理等因素表现出高度关联性的特点。结合中国A股市场3500多家公司的真实样本,对应的数据分析显示本文建立的刻画财务欺诈风险特征指标具有显著的差异性表现。最后,希望指出的是本文的研究结果表明基于财务报表数据为基础,结合非结构化数据的人工智能学习算法能够优化模型的构建并加强和提升对上市公司财务欺诈风险的识别能力,可以有效的实现对公司财务在欺诈方面的探测与预测(Detecting and Predicting)功能。