论文部分内容阅读
本文主要基于相关研究员的深度报告,建立了一个能够跨行业、跨周期、具有统一基准的行业透明度的代理变量。这种代理变量具有针对普遍场景易于计算、针对两种典型场景能够进行针对性计算的优点。下文在研究过程中对此代理变量在不同场景下的表现以及进行具体数量化计算的不同方式进行了详细的对比讨论。并借此代理变量探索了较高的行业透明度是否对企业的盈余管理行为产生抑制作用,以及这种抑制作用的幅度和稳定性。
本文使用的研究方法主要包括基于规则的自然语言处理方法及线性回归方法。其中自然语言处理环节涉及对PDF格式的文本进行自动清洗及基于正则表达式的关键信息提取。本文进行自然语言处理的文本超过15万份或100万页。在主要的线性回归部分都采用了分组对比的方式进行,包括针对进行不同方向盈余管理的样本的对比,以及针对同方向盈余管理样本的跨周期、跨研报类型等的对比,相关线性回归模型超过90个。
本文的分析结果表明,相关行业的透明度越高,则行业内的公司做正向盈余管理时受到的抑制水平也越强;完全透明的行业内的公司进行正向盈余管理的水平会比相对不透明的行业内的公司低17%左右。这个结论除了具有整体的稳定性外,在针对局部年份进行观察、针对特定类型的研报进行观察、针对不同的长研报定义下的数据进行观察以及针对不同的数量化计算方式进行观察时都具有相当的稳定性。
本文的创新性体现为,首次提出了直接评估行业透明度的方法,并依此定量评估了较高的行业透明度在抑制企业盈余管理方面的定量的作用,明确了依靠政策等因素提高行业透明度的积极意义。并且在评估过程中提出了比例模型和数量模型两种恰当的计算行业透明度的方法。这两种数量化方法分别在一类特定场景下具有独特的优势,并且在综合的场景中互为验证。即针对具有单一种类研报类型的样本,比例模型(模型一)具有独特的数量化优势;针对周期较短的样本,数量模型(模型二)具有独特的数量化优势;而在混合多年、多种类研报的数据中,两个模型虽然计算原理不同,但外推结果近乎完全相同。
本文使用的研究方法主要包括基于规则的自然语言处理方法及线性回归方法。其中自然语言处理环节涉及对PDF格式的文本进行自动清洗及基于正则表达式的关键信息提取。本文进行自然语言处理的文本超过15万份或100万页。在主要的线性回归部分都采用了分组对比的方式进行,包括针对进行不同方向盈余管理的样本的对比,以及针对同方向盈余管理样本的跨周期、跨研报类型等的对比,相关线性回归模型超过90个。
本文的分析结果表明,相关行业的透明度越高,则行业内的公司做正向盈余管理时受到的抑制水平也越强;完全透明的行业内的公司进行正向盈余管理的水平会比相对不透明的行业内的公司低17%左右。这个结论除了具有整体的稳定性外,在针对局部年份进行观察、针对特定类型的研报进行观察、针对不同的长研报定义下的数据进行观察以及针对不同的数量化计算方式进行观察时都具有相当的稳定性。
本文的创新性体现为,首次提出了直接评估行业透明度的方法,并依此定量评估了较高的行业透明度在抑制企业盈余管理方面的定量的作用,明确了依靠政策等因素提高行业透明度的积极意义。并且在评估过程中提出了比例模型和数量模型两种恰当的计算行业透明度的方法。这两种数量化方法分别在一类特定场景下具有独特的优势,并且在综合的场景中互为验证。即针对具有单一种类研报类型的样本,比例模型(模型一)具有独特的数量化优势;针对周期较短的样本,数量模型(模型二)具有独特的数量化优势;而在混合多年、多种类研报的数据中,两个模型虽然计算原理不同,但外推结果近乎完全相同。