论文部分内容阅读
随着Internet的高速发展,越来越多的企业将业务应用部署在Web上,从根本上改变了用户使用业务应用、接受企业服务的模式。由于Web上的业务服务应用日趋复杂、访问量骤增,随之而来的问题是海量数据的复杂性和不确定性特征的日益突出。这种不确定的、复杂的海量Web数据,传统Web技术难以有效地处理、进行知识发现和决策制定,已经成为了制约电子商务等应用领域发展的瓶颈。以处理Web上不确定性为主要目标的计算Web智能,为解决上述困境提供了有效的方法学依据。上层信息系统结构的复杂性,要求底层提供更直接面向上层信息表示的基础理论,并用这种表示理论作为桥梁,将上层应用与Web智能机制相结合。相关工作以丰富和发展计算Web智能在粗糙计算和粒度计算两方面的理论基础为目标,从动机、理论和实现三个层面,较系统地提出了以经典粗糙集理论为基石、面向粗糙性表示语义、适于半结构化信息系统表示、基于纯粹总分学关系的粒度粗糙理论。在计算Web智能的上层应用中,提出了基于评估者成熟度特性对协同过滤算法的改进。主要创新点体现在以下几方面:(1)阐释了粗糙性表示语义是粗糙性方法学独立于其它软计算方法的基本特征之一,提出围绕粗糙集理论基本思想,调整底层表示模型,使之显式编码语义上下文。提出构造新的表示模型时,通过使表示模型具有对更广泛信息源的描述能力,扩大粗糙性方法论的适用范围,确定以“属性-值”基础上的元组形式作为新表示模型基本单元的设计思想。提出用应用语境丰富的总分学关系来描述新模型信息单元组合方式,指出基于纯粹总分学关系构建粗糙性的根本动机不仅在于利用总分学和空间信息学、本体论之间联系带来的实际效用,更重要的是作为一种尝试,来展示总分学这一理论的潜在价值。(2)以粒度计算的构造性观点,提出了表示模型粒度表示演算。粒度表示演算以三元组形式的原子信息颗粒为基本原语,表示信息源最简单的完整语义单元。原子信息颗粒通过聚合运算形成复合信息颗粒,复合信息颗粒又通过聚合运算和融合运算表示更复杂的信息结构。鉴于粒度表示演算兼具一般信息源表示模型和粗糙性方法底层表示系统的双重功能,特别定义了几种面向粗糙性构造的特殊复合信息颗粒,及专用于特殊复合颗粒的运算,讨论了信息颗粒之间的总分学关系分类及判定问题,以便为构造粒度粗糙性提供支持。此外,还提出了在粒度表示演算基础上的粒度粗糙性构造方法。首先进行条件信息颗粒到决策属性的示象转换操作,再利用重叠运算判断转换结果与决策信息颗粒之间的总分学关系,定义关于决策颗粒的正则、非正则及不相干三类条件颗粒,分别构成决策颗粒的内核、外壳及主体信息颗粒,对应粗糙性的下界近似、边界及上界近似,从而构造粒度粗糙性。阐释了粗糙总分学在结合总分学的着眼点上与粒度粗糙理论的根本差异。(3)提出将粒度表示演算扩展到本体计算环境和多智能主体系统中的方式。通过对上层本体论进行研究,利用康德合成先验思想的框架,参照各种上层本体系统的设计,从空间、时间、数量范畴、质量范畴、模态范畴和关系范畴,承袭了粒度表示演算在本体计算环境中可直接使用的概念,并对不具备的概念和运算进行了适当的补充和扩展。提出了多智能主体环境下的信息系统表达方式,用信息立方体来可视化的展示了几种特殊的信息颗粒,分析了多智能主体的认知冲突问题,并将协同过滤应用阐释为一种特殊类型的多智能主体决策系统,提出利用隐藏在多智能主体认知数量差异背后的信息来改进协同过滤算法。(4)提出依据熟练用户的评分数据来进行预测可能会达到更高的预测精度这一理性权威偏向假设,基于该假设,提出两方面的改进思想:1)增加具有较高用户评估成熟度的用户评分的权重,称为理性权威偏向感知权重调整,使较成熟用户的影响力在预测中大于不成熟的用户。2)按照一个预先给定的成熟度阈值,将所有评估成熟度小于该阈值的用户数据剪除,称为理性权威偏向感知的数据化简,即对原有的用户-项目评分矩阵进行数据化简。经三种主流协同过滤算法数据集的实验,表明所提改进算法在预测精度和性能上有较大提高。(5)给出了粒度粗糙理论面向数据表示和面向对象编程的两类原型设计方式。面向数据表示的原型利用临床医疗信息系统中,实体-属性-值模型的开源系统来进行快速原型化;而面向对象编程的原型利用Java中的类和对象来表达信息颗粒。定义了本体驱动的Web信息系统功能框架,提出以粒度粗糙理论为基础,形成计算Web智能框架的计算智能引擎。