论文部分内容阅读
在MOSS 2007中,只有位于同一个业务应用程序中的实体之间才能进行关联。业务数据目录可以集成来自后端服务器的多种业务应用程序,位于不同的业务应用程序的实体之间称为异源实体。异源实体之间也可能存在着一定的关联,如果仅靠业务分析师分析这些实体之间的关联信息工作量是很大的,因此如何才能快速的挖掘出这些异源实体之间的关联信息以及如何在MOSS中实现异源实体之间的关联具有重要意义。首先,为了判断词语的相似性,对MOSS中业务数据目录的结构特点进行分析,引入了名称扩展向量,并给出了算法的准则函数,在此基础上提出了根据业务数据目录生成名称扩展向量的算法ENV。算法以同义词词林和WordNet为支撑,根据业务数据目录中的实体信息生成包含中英文同义词、合成词、缩写词的名称扩展向量集,为MHEA算法提供理论基础。其次,为了挖掘MOSS中异源实体之间的关联信息,在名称扩展向量的基础上,提出了MHEA算法。结合MOSS的业务应用程序中实体的结构特征,给出了判断异源实体是否相似的方法,并在此基础上根据实体中FindSpecific方法的属性挖掘异源实体之间的关联信息。算法输出的异源实体关联矩阵集为业务分析师制定解决方案提供理论依据。最后,使用旭硝子汽车玻璃中国有限公司管理信息系统的业务数据目录,对本文提出的方法进行实验测试。在实验中提出了基于MOSS的异源实体关联模型,通过此模型实现MOSS中异源实体之间的关联,并根据测试结果对算法性能进行分析,验证了方法的可行性。