论文部分内容阅读
在面向服务的授权系统中授权策略是重要的组成部分。而授权策略的生成决定了授权系统的执行效率和执行结果。为了提高授权策略的生成效率,实现良好的人机交互功能,以及准确的定义用户授权需求,通过自然语言转化生成策略文件是一种可行的高效率解决方案。而在策略生成过程中将传统自然语言处理与语义技术相结合可以较好的实现这一要求。因此利用基于自然语言处理系统GATE的KIM信息抽取系统,可以较好的实现从自然语言到策略语言的转换。本文分析了自然语言处理工具GATE在自然语言处理流程中的各个环节,授权策略的内容构成以及语法特点以及处理中文输入时需要考虑预处理要求,制定了一个可以解决各项功能需求的完整策略转换生成系统。然后依照功能需求分析了各种可以完成功能目标的工具的性能与使用方法。首先解决了将C语言下的中文分词工具ICTCLAS通过JNI技术引入到Java环境下,实现对中文输入的中文分词预处理。然后依照GATE的自然语言处理流程,收集并制定了符合应用场景的词表,编写命名实体的识别规则JAPE用于实体的短语识别,并实现实体的归类信息抽取。然后依照XML规则,使用XML处理工具DOM将抽取出的信息放入自定义的授权策略模板中,实现策略文件的输出。最后,分析了在实现过程中的技术问题,以及可以进一步提高的处理能力。