论文部分内容阅读
互联网的飞速发展与普及,使我们的工作、学习、生活和娱乐等各个方面正在发生巨大变化,也给我们提出了许多亟需解决的实际问题。例如,如何通过更加智能和个性化的Internet系统,解决“信息过载”和“资源迷向”的问题,让人们能够更充分地使用Internet上的信息资源。本文所研究的“用户个性化兴趣模型”正是是各种个性化智能系统的基础,因此具有理论和实用价值。 本文首先围绕建立用户个性化模型的关键技术进行研究,这些技术包括WEB挖掘、用户行为挖掘、机器学习,以及Agent技术等。Web挖掘是将传统的数据挖掘技术和WEB技术相结合发展而来,是从WEB文档和WEB活动中抽取感兴趣的潜在的有用模式和隐藏的信息,本文主要针对日志挖掘、文本挖掘和结构挖掘三种WEB挖掘技术进行了研究。用户行为挖掘是研究用户个性化兴趣的另一个关键技术,也是本文所设计和研究的用户个性化兴趣模型中所采用的一项重要技术。机器学习技术方面本文主要研究的是在人工智能领域里发展十分成熟的神经网络技术。而Agent技术即智能代理技术,是目前各种智能Internet系统广泛研究和采用的一项新技术,本文也对它的概念和应用作了初步的探讨。 然后本文提出了用户个性化兴趣模型的体系结构,对各部分的实现算法进行了分析和设计,包括评定页面的用户兴趣度、页面的分词、特征提取、通过混合挖掘和学习算法建立和更新用户模型等,以及一些实验。获取用户兴趣所采用的方法是:首先针对用户所浏览的WEB页面,分析这些页面与用户兴趣的相关度,提出“用户兴趣度”的概念,通过暗地观察用户行为(如收藏、保存、打印、浏览时间、拖动滚动条次数等)分析页面的用户兴趣度。同时,进一步分析不同行为所体现的不同的用户兴趣度的等级,以及不同用户行为体现不同的用户兴趣度的能力。然后分析用户所浏览的这些WEB页面中所包含的用户真正感兴趣的内容。主要是结合WEB挖掘技术和机器学习的方法,将文本转化为向量空间,进行特征提取,结合页面的用户兴趣度,进行相似度学习和神经网络学习。 本文最后围绕用户个性化兴趣模型的应用进行了研究,设计了个性化主动信息服务模型。个性化主动信息服务模型又称为个性化的信息推荐系统,首先建立用户的的兴趣模型,然后进行智能的信息搜索与过滤,最后向用户提供个性化的信息推荐,同时根据用户的反馈更新用户的个性化兴趣模型。并且,系统可以通过兴趣小组的方式,结合用户的兴趣模型,实现用户之间的信息共享。最后,本文对智能搜索引擎、用户自适应WEB站点以及基于Internet的个性化学习等应用也进行初步探讨。