论文部分内容阅读
最近几年,各个电视媒体的竞争越来越激烈,受众收视研究也显得越来越重要。那么,电视制播机构和广告主、广告商根据什么来衡量观众的多寡呢?根据什么来判断的节目的观看人数呢?根据什么来确定所要投放广告的时段呢?—收视率。然而现有的收视率调查体系仅仅针对调查得来的数据做一些统计相关的工作,并没有对其进行更高层次的分析。数据挖掘技术可以弥补传统的收视率调查数据处理方法的不足,将数据挖掘技术与收视率调查结合起来,对数据和数据之间的关系进行挖掘分析。
本文对电视节目收视率进行了分析,并以南京市场收视率调查数据为应用背景。针对收视率调查数据中存在的不规则状况,使数据挖掘难以进行。首先对原始数据进行预处理,对存在的噪声数据、空缺数据等,采用相应的预处理技术,为后续的数据挖掘提供了高质量的数据。关系数据库是众多行业和部门用于存储其生产、管理和科研等大量信息的重要形式,数据量的增长极为迅速。在收视率调查研究中使用的就是关系数据库。本文在对事务数据库中布尔型关联规则的典型算法进行分析后,结合关系数据库的特点,采用了一种基于标准SQL语言的关系数据库关联规则挖掘算法。该算法的核心是利用SQL语言的聚集查询和连接等语句对关系数据库进行操作,完成频繁项集和强规则的搜索过程。由于SQL语言对关系数据库操作的高效性,所以算法具有较高的挖掘效率。经过挖掘得到的关联规则对电视制播机构、广告商等都有一定的指导意义。