论文部分内容阅读
随着网络技术的不断发展,如何利用数据挖掘技术从大量的网络信息中挖掘出对人们有用的资源,已经成为研究的热点问题.信息推荐技术需要解决的三个问题是:首先,要理解用户的需求;其次,是能高效、准确地执行查询任务;最后,能把结果很好地组织起来交给用户.目前比较成熟的信息推荐技术是采用面向网络信息来解决以上问题的.但是,这种方式很难执行好用户个性化的检索需求,因此提出了面向用户的个性化推荐模型.通过对通用搜索引擎和元搜索引擎的研究,提出了个性化推荐模型,该模型分为离线部分和在线部分.离线部分由数据预处理和特定的访问挖掘任务组成,数据预处理将网络服务器的访问日志文件以及站点的相关文件生成用户文件和事务文件;特定的访问挖掘是利用聚类算法来生成网页聚类.模型的在线部分主要是利用离线部分生成的网页聚类,再根据用户的当前访问操作行为,动态地为用户推荐下一步访问操作.在线部分主要是由:用户接口、兴趣学习器、个性化分析器、推理器、网络数据连接管理器、个性化过滤器和网络服务器等组成.在线部分涉及到的关键算法有:兴趣学习算法、个性化分析算法、个性化过滤算法和推理算法,此外还对模型的一些简单的语法规则进行了定义,通过实验环境实现了一个界面简单的推荐模型.