论文部分内容阅读
摘 要:关联规则挖掘技术可从大量繁杂的数据事务中挖掘并分析它们之间隐含的相关信息。本文在分析关联规则技术和社会服务应用的基础上,提出关联规则挖掘技术应用在社会服务领域的挖掘应用。通过关联规则技术对社会服务对象数据的分析应用,发掘数据间相关性,以实现社会服务个性化智能分析和推荐服务,并为提高社会服务能力提供智力决策的依据。
关键词:关联规则;数据挖掘;社会服务
中图分类号:TP391;TP311.13 文献标识码:A 文章编号:2096-4706(2018)02-0150-03
Application Study on Association Rule Mining Technology in Social Service
——Taking a sports college as an example
YIN Qian,LI Zhifu,HAN Shuang
(Anhui Sports Vocational and Technical College,Hefei 230051,China)
Abstract:Association rule mining technology can excavate the related information from a large number of complicated data transactions. This paper proposes the application of association rules mining technology in the field of social service mining based on the analysis of association rules and social service applications. The correlation between data is explored by the analysis and application of association rules technology to the data of social service objects,and the personalized intelligence analysis and recommendation service of social service is realized,and our method can provide intellectual decision making for improving the social service ability.
Keywords:association rule;data mining;social service
0 引 言
近年来,国家竞技体育发展方式的有效转变、全民健身上升为国家战略及体育产业的提出并受到高度重视,使得高等体育院校的办学模式由“教学、科研、训练”相结合转变为实现现代高校“人才培养、科学研究、社会服务”的三大职能[1]。现代高等体育院校不仅服务竞技体育,也参与众多大型体育赛事的组织和服务工作,是培养体育人才的摇篮。拥有丰富的体育项目、齐全的场馆设施、一流的运动技术、雄厚的师资、完善的仪器设备和先进的科研成果等,这些都是提供社会服务所需要的难能可贵的资源[2],现有高校社会服务范围包括竞技体育、群众体育等。随着社会经济的发展和大众健身意识的增强,体育社会服务的内容需不断地扩展和深化,然而受制于体育领域行业知识领域化,目前尚未有关于挖掘和深化社会服务内容的相关研究。因此,本文试图从数据挖掘中的关联规则知识深层挖掘方面来分析社会服务内容。
1 体育院校社会服务存在的问题
高等体育院校的社会服务从广义上讲,指为社会培养各类体育人才,狭义上讲指以自身体育场馆、人才优势等来完成社会需求和合作的活动。社会服务從广义和狭义上均是社会对高校进行反哺的过程,两者相互作用,互惠共进。但现有社会服务内容多是由社会组织提出需求的内容,例如组织一场体育活动等。其相关延伸的服务内容少有人研究,原因在于未能对社会服务进行深层次的挖掘研究并发现其中的规律。
2 数据挖掘中关联规则发掘
2.1 相关概念
数据挖掘技术是从数据仓库中获取高可信度知识,发现人们不易察觉的隐含模式。关联规则算法典型案例“啤酒+尿布”中提到关联算法的两个概念:支持度和置信度。支持度Support指的是数据集中包含某几个特定项的概率,比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度为5%;和关联算法很相关的另一个概念是置信度Confidence,也就是在数据集中已经出现A时,B发生的概率,置信度的计算公式是:A与B同时出现的概率/A出现的概率即买尿布→买啤酒的概率。用公式描述为:
Support(尿布,啤酒)≥5%andConfidence(尿布,啤酒)≥65%。
原来,美国妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。
这个发现为商家带来了大量的利润,利用类似知识发现啤酒和尿布销售之间的联系的过程,可以为发掘某项社会服务延伸其他服务提供一些启示。
2.2 关联规则挖掘技术的应用
关联规则除了应用在有名的购物篮分析之外,在中医药挖掘分析[3]、图书馆个性化服务[4,5]、证券分析、平台信息推荐服务和通讯行业等领域都有着广泛的应用。它主要通过分析日常的大量繁杂信息,从中找出一定的联系,据隐含关联信息为依据,为客户群智能推荐相关的其他个性化服务。 2.3 关联规则挖掘求解问题的步骤
从数据库中发现强关联规则的步骤为:(1)预处理与挖掘任务有关的数据,根据具体问题的要求对数据库进行相应的处理,从而生成規格化的数据库;(2)从数据库中找到所有支持度大于最小支持度的项集,这些项集称为频繁项集;(3)使用上面找到的频繁项集产生期望的规则,这些规则必须满足最小置信度,形成输出规则。
3 数据准备和处理
3.1 数据准备
原始数据通过调查问卷方式获得,被研究者为五年时间内某体育类高校的社会服务对象,包括各种社会培训(青少年拓展类、裁判员培训、体育指导员培训、成人体育项目培训等)和组织或参与大型体育赛事服务等的人员,问卷累计调查两千余人。
其中社会服务对象的个人基本信息包括年龄、性别、工作单位、受教育程度等。社会服务项目包含具体社会服务名称、服务级别和服务类型等信息。
3.2 数据预处理
原始数据形式要实现挖掘还需进行数据的清洗、预处理与转换,将其转换成需要的数据形式。在高校社会服务对象信息数据库中存有大量的信息。如果需要找出的是服务对象年龄、职业、学历与其接受服务项目的关联规则,我们需要关心的就是其信息中的年龄、职业、学历。其他的如姓名、性别等可以认为是无关信息。此外还要对选择后的数据进行清理,比如说某些字段属性值可能存在空缺值或者噪声不一致的现象。
4 实验结果
数据中的相关性有时隐藏在内部,不易发现。通过关联规则可发现内部两个变量或多个变量之间的相关性,进而找到其规律。本文以8位社会服务对象为例,简要介绍关联规则在体育院校社会服务中的应用。
表1所示为某体育院校社会服务事物中的服务类型表,该表显示了社会服务对象与参与服务类型之间的关系。采用Apriori算法可以得到支持度大于35%的数据,如表2所示。从单向统计可以看出,62.5%的人参与了社会体育指导员培训,50%的人参与某体育项目学员和组织管理人员服务,37.5%的人参与赛事裁判员、裁判员培训和志愿者的服务中。
表3所示为支持度为37.5%的四种服务类型的组合,从表4可看出37.5%的社会服务对象同时参与社会体育指导员培训,裁判员培训和赛事裁判员。参与社团体育指导员培训的服务对象同时参与裁判员培训和赛事裁判员的支持度为37.5%,置信度为66.6%,因此得到如下规则:
服务类型(社会体育指导员培训)∧服务类型(裁判员培训)服务类型(赛事裁判员)[sup port=37.5%,confidence=66.6%],据此得出其隐含的关联。
表4 支持度大于35%同时参与三种社会服务的数据
三项统计 支持度(%)
社会体育指导员培训、裁判员培训、
赛事裁判员 37.5
5 结 论
长期以来,体育院校承担了许多体育方面的社会服务工作,但鲜有人根据大量积累的资料对社会服务对象分类挖掘,其根本原因在于体育院校与数据挖掘知识之间的专业领域限制。因此,本文根据实际社会服务数据,采用数据挖掘中的关联规则技术挖掘并发现数据间隐藏的知识尤其可贵。在对目标客户群进行有效分类后,可以更加有针对性的提供相关服务和个性化服务,这对于提高体育院校社会服务能力有着重要作用。
参考文献:
[1] 张新军.高校体育对所在城市社会服务作用的探讨——以东阳市为例 [J].当代体育科技,2015,5(26):176+178.
[2] 王鲲.高等体育院校社会服务模式研究 [J].山东体育科技,2011,33(3):54-57.
[3] 袁楠,金晖,田玲,等.基于聚类和模糊关联规则的中医药对量效分析 [J].计算机应用研究,2009,26(1):59-61.
[4] 刘志勇,王阿利,魏迎,等.关联规则数据挖掘在图书馆个性化服务中的应用研究 [J].电子设计工程,2012,20(7):16-17+20.
[5] 陈力,李林,秦臻,等.关联规则在提高图书馆服务质量中的应用 [J].情报杂志,2008(2):145-146+150.
关键词:关联规则;数据挖掘;社会服务
中图分类号:TP391;TP311.13 文献标识码:A 文章编号:2096-4706(2018)02-0150-03
Application Study on Association Rule Mining Technology in Social Service
——Taking a sports college as an example
YIN Qian,LI Zhifu,HAN Shuang
(Anhui Sports Vocational and Technical College,Hefei 230051,China)
Abstract:Association rule mining technology can excavate the related information from a large number of complicated data transactions. This paper proposes the application of association rules mining technology in the field of social service mining based on the analysis of association rules and social service applications. The correlation between data is explored by the analysis and application of association rules technology to the data of social service objects,and the personalized intelligence analysis and recommendation service of social service is realized,and our method can provide intellectual decision making for improving the social service ability.
Keywords:association rule;data mining;social service
0 引 言
近年来,国家竞技体育发展方式的有效转变、全民健身上升为国家战略及体育产业的提出并受到高度重视,使得高等体育院校的办学模式由“教学、科研、训练”相结合转变为实现现代高校“人才培养、科学研究、社会服务”的三大职能[1]。现代高等体育院校不仅服务竞技体育,也参与众多大型体育赛事的组织和服务工作,是培养体育人才的摇篮。拥有丰富的体育项目、齐全的场馆设施、一流的运动技术、雄厚的师资、完善的仪器设备和先进的科研成果等,这些都是提供社会服务所需要的难能可贵的资源[2],现有高校社会服务范围包括竞技体育、群众体育等。随着社会经济的发展和大众健身意识的增强,体育社会服务的内容需不断地扩展和深化,然而受制于体育领域行业知识领域化,目前尚未有关于挖掘和深化社会服务内容的相关研究。因此,本文试图从数据挖掘中的关联规则知识深层挖掘方面来分析社会服务内容。
1 体育院校社会服务存在的问题
高等体育院校的社会服务从广义上讲,指为社会培养各类体育人才,狭义上讲指以自身体育场馆、人才优势等来完成社会需求和合作的活动。社会服务從广义和狭义上均是社会对高校进行反哺的过程,两者相互作用,互惠共进。但现有社会服务内容多是由社会组织提出需求的内容,例如组织一场体育活动等。其相关延伸的服务内容少有人研究,原因在于未能对社会服务进行深层次的挖掘研究并发现其中的规律。
2 数据挖掘中关联规则发掘
2.1 相关概念
数据挖掘技术是从数据仓库中获取高可信度知识,发现人们不易察觉的隐含模式。关联规则算法典型案例“啤酒+尿布”中提到关联算法的两个概念:支持度和置信度。支持度Support指的是数据集中包含某几个特定项的概率,比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度为5%;和关联算法很相关的另一个概念是置信度Confidence,也就是在数据集中已经出现A时,B发生的概率,置信度的计算公式是:A与B同时出现的概率/A出现的概率即买尿布→买啤酒的概率。用公式描述为:
Support(尿布,啤酒)≥5%andConfidence(尿布,啤酒)≥65%。
原来,美国妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。
这个发现为商家带来了大量的利润,利用类似知识发现啤酒和尿布销售之间的联系的过程,可以为发掘某项社会服务延伸其他服务提供一些启示。
2.2 关联规则挖掘技术的应用
关联规则除了应用在有名的购物篮分析之外,在中医药挖掘分析[3]、图书馆个性化服务[4,5]、证券分析、平台信息推荐服务和通讯行业等领域都有着广泛的应用。它主要通过分析日常的大量繁杂信息,从中找出一定的联系,据隐含关联信息为依据,为客户群智能推荐相关的其他个性化服务。 2.3 关联规则挖掘求解问题的步骤
从数据库中发现强关联规则的步骤为:(1)预处理与挖掘任务有关的数据,根据具体问题的要求对数据库进行相应的处理,从而生成規格化的数据库;(2)从数据库中找到所有支持度大于最小支持度的项集,这些项集称为频繁项集;(3)使用上面找到的频繁项集产生期望的规则,这些规则必须满足最小置信度,形成输出规则。
3 数据准备和处理
3.1 数据准备
原始数据通过调查问卷方式获得,被研究者为五年时间内某体育类高校的社会服务对象,包括各种社会培训(青少年拓展类、裁判员培训、体育指导员培训、成人体育项目培训等)和组织或参与大型体育赛事服务等的人员,问卷累计调查两千余人。
其中社会服务对象的个人基本信息包括年龄、性别、工作单位、受教育程度等。社会服务项目包含具体社会服务名称、服务级别和服务类型等信息。
3.2 数据预处理
原始数据形式要实现挖掘还需进行数据的清洗、预处理与转换,将其转换成需要的数据形式。在高校社会服务对象信息数据库中存有大量的信息。如果需要找出的是服务对象年龄、职业、学历与其接受服务项目的关联规则,我们需要关心的就是其信息中的年龄、职业、学历。其他的如姓名、性别等可以认为是无关信息。此外还要对选择后的数据进行清理,比如说某些字段属性值可能存在空缺值或者噪声不一致的现象。
4 实验结果
数据中的相关性有时隐藏在内部,不易发现。通过关联规则可发现内部两个变量或多个变量之间的相关性,进而找到其规律。本文以8位社会服务对象为例,简要介绍关联规则在体育院校社会服务中的应用。
表1所示为某体育院校社会服务事物中的服务类型表,该表显示了社会服务对象与参与服务类型之间的关系。采用Apriori算法可以得到支持度大于35%的数据,如表2所示。从单向统计可以看出,62.5%的人参与了社会体育指导员培训,50%的人参与某体育项目学员和组织管理人员服务,37.5%的人参与赛事裁判员、裁判员培训和志愿者的服务中。
表3所示为支持度为37.5%的四种服务类型的组合,从表4可看出37.5%的社会服务对象同时参与社会体育指导员培训,裁判员培训和赛事裁判员。参与社团体育指导员培训的服务对象同时参与裁判员培训和赛事裁判员的支持度为37.5%,置信度为66.6%,因此得到如下规则:
服务类型(社会体育指导员培训)∧服务类型(裁判员培训)服务类型(赛事裁判员)[sup port=37.5%,confidence=66.6%],据此得出其隐含的关联。
表4 支持度大于35%同时参与三种社会服务的数据
三项统计 支持度(%)
社会体育指导员培训、裁判员培训、
赛事裁判员 37.5
5 结 论
长期以来,体育院校承担了许多体育方面的社会服务工作,但鲜有人根据大量积累的资料对社会服务对象分类挖掘,其根本原因在于体育院校与数据挖掘知识之间的专业领域限制。因此,本文根据实际社会服务数据,采用数据挖掘中的关联规则技术挖掘并发现数据间隐藏的知识尤其可贵。在对目标客户群进行有效分类后,可以更加有针对性的提供相关服务和个性化服务,这对于提高体育院校社会服务能力有着重要作用。
参考文献:
[1] 张新军.高校体育对所在城市社会服务作用的探讨——以东阳市为例 [J].当代体育科技,2015,5(26):176+178.
[2] 王鲲.高等体育院校社会服务模式研究 [J].山东体育科技,2011,33(3):54-57.
[3] 袁楠,金晖,田玲,等.基于聚类和模糊关联规则的中医药对量效分析 [J].计算机应用研究,2009,26(1):59-61.
[4] 刘志勇,王阿利,魏迎,等.关联规则数据挖掘在图书馆个性化服务中的应用研究 [J].电子设计工程,2012,20(7):16-17+20.
[5] 陈力,李林,秦臻,等.关联规则在提高图书馆服务质量中的应用 [J].情报杂志,2008(2):145-146+150.