论文部分内容阅读
随着信息技术的发展,审计领域的信息量剧增,传统的计算机辅助审计软件在处理这些巨量信息时,逐渐表现出审计周期长、智能化程度低的局限性。为了克服这些局限性,本文提出了智能提问系统。与传统的以查报表为手段的审计方式相比,该系统的灵活性较高,能够迅速确定审计疑点。本文首先归纳概括了汉语疑问句常用的十大问点类型,然后研究了使用最大熵模型进行问点标注的方法,以标注好的语料为输入生成问句。另外,借鉴犯罪心理测试领域的问题编排技术,对生成的问句进行了筛选编排。本文构造的智能提问系统主要包含两个模块:一个是问句自动生成模块;另一个是问题编排模块。问句自动生成模块使用社会保险领域中的政策文本作为输入,在构建了该领域中常用句型模板的基础上,对文本中的事实和规则实施抽取,并以此为基础生成问句,作为输出。在生成问句时,使用最大熵理论:对社保审计领域具有代表性的政策文本实施人工标注,作为训练语料对最大熵模型进行训练,确定模型参数。然后使用该模型对从文本中抽取出的信息进行标注,将标注后的句子输入到本文所提出的问句生成算法,产生问句。问题编排模块则以生成的问句为基础,借鉴犯罪心理测试领域中的编题技术并结合社保审计领域的实际,给出问题编排时需要遵循的原则和编排的方法。本文所提出的这种能够用于辅助审计的智能提问系统,其特点在于可以根据输入产生问句,并能借鉴犯罪心理测试领域的编题技术,对产生的问句进行编排,发出提问,判断从业人员是否违法,从而发掘审计疑点,达到审计目的。该系统能够提供一种高效、智能的审计辅助手段。实验表明利用最大熵方法生成问句,并用来辅助审计是可行的。