论文部分内容阅读
Internet上充斥着各式各样的大量信息,为了能从浩瀚的信息汪洋中迅速准确地捕捉企业所需的信息,企业需要有一种在Internet上进行自动搜索、自动归类的知识挖掘系统.知识订阅系统可以根据企业需要知道的主题信息,定期的将与该主题有关的文档传给企业,并实现对文档的自动分类和内容分析,将分析结果也定期传给企业.知识订阅系统由三个部分组成:输入初始化模块、web挖掘模块和意见归纳模块.该文重点探讨了知识订阅系统输入初始化部分的实现及其算法.知识订阅的输入初始化模块由四个子模块组成,即计划目标分解系统、因素求解专家系统、经营情况分析系统和解释专家系统.其中,计划目标分解系统要将企业以自然语言输入的年度计划提取分解成需求关键词,这里,要用到自然语言处理和信息提取的一些技术;因素求解专家系统要根据上一步计划目标分解系统得到的需求关键词,找出一些能够实现企业计划或目标的因素关键词,这一部分,将依靠神经网络专家系统来实现;经营情况分析系统就是要通过经营情况分析修正前面得到的影响因素关键词,得到影响计划实现的瓶颈问题,这部分的实现要依靠财务报表分析和管理经营诊断的技术;解释专家系统则是将影响企业计划或目标的瓶颈因素关键词表示成可以反映用户需求的方式,这一部分也是使用神经网络专家系统来实现.该文介绍了在知识订阅的输入初始化模块实现中将使用的自然语言理解、人工智能、神经网络专家系统、经营情况分析系统等技术,并基于目前已有的技术具体探讨了初始化模块中四个子模块的算法实现.文章的最后,总结了现有的工作,对进一步完善知识订阅输入初始化模块的工作提出了意见和改进的方向.