论文部分内容阅读
随着社会分工日趋细致,读者对图书馆信息服务的精确性、及时性和个性化的要求也日趋提高。图书馆作为文献收藏和提供文献服务的机构,所存储的信息量日趋庞大。如何在海量的信息中快速准确的获取信息将是读者面临的一个严峻问题。本文在分析现有的图书馆管理系统后,发现现有的图书馆管理系统不具备个性化信息服务功能。因此,针对原有系统的不足,对原有系统的功能进行了扩充,增加了个性化信息服务子系统。重点研究了关联规则挖掘及聚类分析的应用技术,提出了数据挖掘在图书馆个性化信息服务中的应用。本文的工作主要体现在以下几点:(1)对基于数据挖掘技术的个性化信息服务子系统进行了需求分析、流程分析,然后进行了整体结构的设计和功能模块的设计。接着建立了用例图、活动图、类图、序列图,从多个视角基于UML进行了系统建模。最后,对数据库进行了详细的设计。(2)对原始数据进行预处理,形成待挖掘的数据集,并对如何确定关联规则挖掘的支持数给出分析示例,然后用weka软件的K-means算法对确定的支持数给予验证。(3)根据相关图书推荐流程的分析,得出图书关联规则的挖掘只需挖掘频繁2-项集即可。接着通过对经典Apriori算法流程的研究,提出了基于结构化查询语言SQL的关联规则挖掘算法,此算法直接利用DBMS实现图书之间关联规则的挖掘。在形成候选2-项集的过程中就完成了此2-项集的支持数统计,不需要逐次扫描数据库完成支持数的统计,极大地提高了算法的执行效率。最终实现了对图书馆图书关联规则的挖掘,并将挖掘结果应用于个性化信息服务中。(4)在个性化信息服务子系统的设计上,依托SSH整合框架的开发环境,遵循MVC的分层模式。以“资源检索功能”的实现为例,展示如何实现各层,最终,实现了一个B/S结构的图书个性化信息服务子系统。最后,全面总结了本文的研究内容并对未来的研究方向作了进一步展望。