基于人工鱼群的聚类算法在读者行为分析的应用研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:zsdown520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化时代里,数据存储量与日俱增,为了从这些看似毫无规律的数据中得到有价值的资料,数据挖掘技术应时而生,在近一个多世纪中,它得到了飞速的发展,且在诸多领域中应用越来越普遍。其中,对聚类分析的研究一直是数据挖掘发展历程中的重点内容之一。最近几十年,新兴的群体智能算法如粒子群算法、蛙跳算法等在优化领域获得了巨大的成功。作为群体智能算法之一,人工鱼群算法自被提出后,引起了诸多专家学者的注意,为了提高实用性,它被广泛应用到不同领域,其中包括数据挖掘领域。另外,高校图书馆有着相对固定的读者,大批用户数据在日常的读者服务中产生。图书馆系统中的记录是读者实现自我需要的行为结果,也是图书馆资源被读者认可的有力凭证。一些与用户相关的知识隐藏在读者信息、馆藏图书信息以及用户借阅记录等数据之间。出于商业利益的考虑,目前各界对高校读者行为分析的研究还不是很多。本论文通过研究K-means聚类算法和人工鱼群算法,设计了一种新的基于改进人工鱼群的混合聚类算法,并以此作为核心算法,对文中提出的三种读者行为分析模型进行聚类,为图书馆对读者借阅规律的把握、馆藏图书受喜爱程度,服务模式提升等方面提供一定的依据。首先,设计并实现了一种基于改进人工鱼群的混合聚类算法。该算法从以下几个方面进行了改进:对参数视野采用矢量的形式,以待聚类样本的各属性值的标准差为基准;对追尾算子融合粒子群策略;在迭代过程中随机选择一小部分不为最优状态的人工鱼,按照最近邻原则,执行K-means行为。实验证明,该算法综合了人工鱼群算法和K-means两者的优点,不仅能克服K-means敏感的初始质心选择问题,同时还能提高AFSA后期收敛速度,可以用相对较短的时间获得质量最优的聚类簇。其次,对图书馆系统中读者基本信息、馆藏信息和用户借阅记录,进行整理、清洗和转化,根据本文研究需要,提出的三种读者行为分析模型:读者借阅模型、图书流通模型和单本借阅特性模型。最后,将该改进的算法应用到三个分析模型中,发现其中的规律特点,为指导读者借阅行为,提高资源利用率,优化服务模式等提供事实依据。
其他文献
随着科技的进步,遥感技术已经发展的日趋成熟,而遥感技术由于其自身的特性,已经被广泛的应用在土地利用分类上。土地利用分类作为一项基础的研究工作,把遥感技术应用在其中,
在当今这个信息化的时代,网络技术正在以前所未有的速度飞快发展。新一代宽带多媒体通信卫星系统作为网络与通信技术飞速发展的成果,有着广阔的研究价值和社会效益。宽带多媒体
随着网络经济和网络时代的发展,计算机网络的安全已经引起了世界各国的共同关注,计算机网络蓬勃发展的同时,也面临着巨大的挑战。面对网络安全的严峻挑战,如何在深入研究问题实质
数据挖掘(Data Mining)是人工智能与数据库领域当前研究的一个热点,引起了大量学者与专家的关注。在众多的数据挖据的方向中,属性约简是其中的一个重要研究课题。一个原始的数据
入侵防御技术作为防护计算机网络免遭入侵破坏的一种有效手段在网络安全领域日益受到研究人员的重视,成为目前信息安全领域的研究热点之一。本文分析了人体免疫系统的特异性
在网络技术高速发展的今天,网络安全的现状越来越让人担忧,网络安全的重要性越发明显,随之产生的各种网络安全技术也得到了不断的发展,网络入侵检测系统是目前提高网络安全的
随着计算机网络技术的飞速发展,Internet已发展成世界上规模最大的计算机互联网络。IPv4在经历了20世纪后20年令人惊异的增长后,已经逐渐逼近自己的极限,IPv6解决方案的提出,为21
随着网络技术的飞速发展,新的网络协议及应用不断涌现,网络设备对性能和灵活性的要求也越来越高。传统的基于通用处理器及专用集成电路的网络处理方式逐渐暴露出种种弊端,一种基
随着计算机和通信技术的不断融合,计算机网络已经成为一种基础设施而遍及社会生活的每个角落。从最初的ARPANET到今天的Internet,网络规模不断扩大;从简单的文件共享到目前的电
数字作品具有很多优点,包括易于制作和复制、有效的存储以及快速和低成本的分发。这些优点使得内容生产和分发的费用和时间显著的减少,为内容提供商带来了新的商业机会。尽管数