基于最大熵的智能提问系统及其在审计中的应用

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:x117799589
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,审计领域的信息量剧增,传统的计算机辅助审计软件在处理这些巨量信息时,逐渐表现出审计周期长、智能化程度低的局限性。为了克服这些局限性,本文提出了智能提问系统。与传统的以查报表为手段的审计方式相比,该系统的灵活性较高,能够迅速确定审计疑点。本文首先归纳概括了汉语疑问句常用的十大问点类型,然后研究了使用最大熵模型进行问点标注的方法,以标注好的语料为输入生成问句。另外,借鉴犯罪心理测试领域的问题编排技术,对生成的问句进行了筛选编排。本文构造的智能提问系统主要包含两个模块:一个是问句自动生成模块;另一个是问题编排模块。问句自动生成模块使用社会保险领域中的政策文本作为输入,在构建了该领域中常用句型模板的基础上,对文本中的事实和规则实施抽取,并以此为基础生成问句,作为输出。在生成问句时,使用最大熵理论:对社保审计领域具有代表性的政策文本实施人工标注,作为训练语料对最大熵模型进行训练,确定模型参数。然后使用该模型对从文本中抽取出的信息进行标注,将标注后的句子输入到本文所提出的问句生成算法,产生问句。问题编排模块则以生成的问句为基础,借鉴犯罪心理测试领域中的编题技术并结合社保审计领域的实际,给出问题编排时需要遵循的原则和编排的方法。本文所提出的这种能够用于辅助审计的智能提问系统,其特点在于可以根据输入产生问句,并能借鉴犯罪心理测试领域的编题技术,对产生的问句进行编排,发出提问,判断从业人员是否违法,从而发掘审计疑点,达到审计目的。该系统能够提供一种高效、智能的审计辅助手段。实验表明利用最大熵方法生成问句,并用来辅助审计是可行的。
其他文献
传统伤口评估需要临床医师凭借经验对伤口使用毫米尺等工具进行手动测量大小和视觉观察给出伤病级别、感染等伤口状态评估,因其较低效率占用了海量医疗资源。多光谱图像可获
灵敏性分析是研究改变参数的值及其传播过程,考察参数变化对于目标对象所产生的影响,从而对系统参数和结构的重要性进行量化分析,在系统的特性分析和异常特征发现方面有着广泛的
随着计算机网络技术的快速发展以及数据库、数据仓库等数据仓储技术在管理信息系统中日益广泛的应用,互联网上的信息迅猛增长,海量数据不断产生,Web逐渐成为人们进行资源获取与
当前本体已广泛应用于语义网、电子政务、数据挖掘等传统领域,且正逐渐扩展至云计算、物联网等新兴学科中。本体的构建工作是其应用研究的基础工作,但目前尚无统一标准,而人工构
压缩感知作为一种新颖的信号获取理论,自提出以来,迅速在众多领域引起了高度的关注。有趣的是,压缩感知框架可以被看作一种加密方案。与传统加密方案相比,压缩感知加密方案具
无线自组织网是由一组带有无线收发装置的移动节点组成的一种无线移动通信网络,它不依赖于固定的基础设施,网络中的节点利用自身的无线收发设备交换信息。它具有无中心、自组织
随着网民人数的不断增多,可分配IPv4地址面临枯竭,使用下一代互联网协议IPv6替代IPv4是解决地址不足问题的根本方法。但是协议升级不可能在短时间内完成,因此IPv4向IPv6过渡技术
多包接收技术可以同时接收多份数据包,减少信道冲突,提高无线网络的吞吐量,近年来成为无线网络的研究热点,本文在分析多包接收物理层实现技术的基础上,通过调节节点发射功率,采用跨
虚拟现实技术一直是计算机图形学领域的研究热点之一,而三维模型作为事物在虚拟世界中的表现形式,场景的快速生成一直被人们所重视。植物是常见的自然景观,其自身的复杂性决定了
21世纪是生命科学和信息技术的世纪,共调控基因挖掘是生物学家在基因功能关联领域研究工作的核心之一。DNA微阵列芯片的发展使作为生物信息学数据源的表达水平数据已经能够通