论文部分内容阅读
电子商务环境中,客户知识已成为企业重要的竞争资源。如何更好地了解客户喜好、刺激并满足客户需求,是企业在白炙化竞争环境中取胜的关键问题所在。知识挖掘作为从大量数据中发现有价值的潜在知识的重要理念,得到企业以及相关研究人员的高度重视。但企业中客户数据的语义异构问题成为知识挖掘工具有效运行的最大障碍,降低了客户知识模式获取的有效性,因此本文对基于语义集成的客户知识挖掘进行了研究。全文由引言和五个章节构成,主要内容如下:引言阐述了文章研究的背景和意义;综述了有关语义集成和客户知识挖掘相关内容的国内外研究现状。其中有关对语义集成、客户知识内涵的理解、基于本体的知识管理框架构建及知识挖掘的困境和解决方法等研究成果,为找出本文研究的切入点给出了一定的理论启发和指导;说明了文章研究的方法和内容。第一章是关于文章研究的基础理论和技术概述。主要概述了企业信息集成的主要内容,包括异构数据和企业信息集成的目标、企业信息集成的传统方法、基于本体的企业信息语义集成;概述了客户关系生命周期、客户价值、客户忠诚度以及客户满意度等客户知识理论的主要内容,为客户知识挖掘任务的拟定奠定了理论分析基础;概述了主要支撑技术的基本内容,包括知识挖掘方法和技术、数据仓库技术以及本体技术。第二章是关于基于企业本体的客户数据语义集成策略与方法。提出了企业本体构建的新思路,即从软件工程开发的角度,用结构化方法把本体构建流程划分为规划、分析、设计、实施和运行五个阶段,而在具体的分析阶段,用原型化方法进行不断地修改和完善。提出了基于企业本体分别对客户关系数据库和Web文本语义集成的策略和方法,即用混合本体集成方式对关系数据库进行语义集成,包括逆向工程的ER模式元素识别、基于ER模式元素的领域本体学习、基于本体映射的元数据生成;用单本体集成方式对Web文本进行语义集成,即利用聚类和关联规则挖掘技术分析和标注Web文本中的概念和概念间关系。第三章是关于基于语义集成的客户知识挖掘模型。模型分为有价值客户数据收集和语义集成、客户数据语义集成结果分析、基于语义集成的客户知识挖掘、客户知识处理、客户知识存储及客户知识应用六大循环模块。主要论述了语义集成中有价值客户数据的收集、客户知识挖掘任务的确定及基于语义集成的客户知识挖掘的过程。第四章将理论研究成果应用于实验。实验主要对手机产品领域中有价值客户的Web日志数据进行收集,并进一步整理为Web文本集和交互特征集。基于手机产品本体对Web文本集进行语义分析和标注,根据交互特征集对Web文本中的概念和概念关系赋予客户兴趣度权值;在Web文本语义分析和标注结果的基础上,运用关联规则Apriori算法发现具有潜藏语义关系的客户兴趣模式;利用Web文本测试集,对该模式的有效性进行了验证。第五章总结了全文的主要内容和结论,反思了论文存在的不足,展望了将来研究的重点。本文系教育部人文社科重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究(批准号:08JJD870225)”的研究成果之一。