多维序列模式挖掘算法在广播收听率分析中的研究与应用

来源 :河北工业大学 | 被引量 : 2次 | 上传用户:laoxu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库和计算机网络的广泛应用,加上使用先进的自动数据生成和采集工具,人们所拥有的数据量急剧增大。数据挖掘技术正是目前解决“数据爆炸”但“信息贫乏”的一种有效方法。目前,在广播收听调查领域,从上个世纪30年代尼尔森公司成立和BBC对听众进行每日调查开始,关于广播传播效果的分析与描述就越来越被“数字”所替代,但是由于缺乏对收听率数据进行再分析的能力,不善于剖析数据,而只能被动地、表面化地接受调查机构给予的原始数据或简单结论。针对广播收听调查领域存在的这种情况,本文将数据挖掘技术中的多维序列模式挖掘算法应用到广播收听率分析当中,可以使广播电台根据指标数据和数据挖掘信息来改善管理,进行更科学合理的节目评估、人员考核、听众群体分析等,同时也为广播媒体领域的专业研究的提供了很有价值的信息。本文在研究了一些经典的序列模式挖掘算法的基础上,结合广播收听情况分析的具体问题和业界相关知识,提出了一种基于时态约束的多维序列模式挖掘算法,这种算法首先将多维信息作为序列的一个元素嵌入到序列之中,形成一个新的序列,然后在基于模式增长的序列模式挖掘算法PrefixSpan算法的基础上,引入了时间区间的归并与扩展技术,使挖掘出来的多维序列模式具有了时效性。本文以“北京中视广联收听率分析系统”为研究背景,在实现了计算各种收听指标等基本功能的基础上,将基于时态约束的多维序列模式挖掘算法应用其中,基本实现了从原始数据的预处理到最后的对挖掘结果的评估与优化这样一个数据挖掘过程。最后,对本文工作进行了总结,提出了进一步的工作方向和思路。
其他文献
本文在综合分析XML安全现有成果的基础上,将具有我们自主知识产权的排列码加密算法应用到XML安全领域。本文详细介绍了排列码加密算法原理,用Java语言实现了分组长度为8比特
隐蔽通道指操作系统和网络环境中客观存在的,且本意不是被设计用于传输信息的通信信道。隐蔽通道可被恶意攻击者利用,实现隐蔽的数据传输,危害系统安全。在智能手机操作系统A
随着多媒体数字信号处理应用领域的迅速发展,对计算机处理能力的要求越来越高。可重构处理系统将微处理器的灵活性和ASICs的高效性结合起来,通过配置可重构处理单元以满足不
分布式拒绝服务(Distributed Denial of Service,DDoS)攻击已经成为当今网络上广泛传播的问题。这种攻击行为使网站服务器充斥大量要求回复的信息,消耗网络带宽和系统资源,导致
信息资源的曰益膨胀使得数据管理问题逐渐成为研究焦点。当前越来越多的数据库应用依赖于多个独立的数据源,对于给定的约束,这些数据源分别是一致的,但集成时就可能是不一致的。
由于获取图像的手段不同,图像中总存在许许多多的噪声,在图像预处理中如何使图像的噪声降到最低,最大化的获取图像中的有用信息,一直是图像处理中的研究热点。目前图像噪声的滤除
近些年来,越来越多的企业提供了外包加密数据共享服务,但该应用所面临的数据安全问题依然没能很好的解决,代理重加密方案已经成为了核心解决思路之一。为了适应灵活多变的云
本文主要论述了怎样在计算机上通过程序的控制来模拟电话的呼叫处理的过程。由C++面向对象的程序语言编写应用程序,定义好该程序所需要使用的资源。当执行时,从GRM(资源管理
当前,高校图书馆数据管理系统各自为政。随着网络技术的发展,XML 的应用越来越广泛,它已经成为 Internet 上数据表示和交换的新标准,同时也被认为是用来定义半结构化数据最有效的
分布式计算框架利用廉价PC构建多核集群解决了大规模并行计算问题,但是在分布式计算框架上编程需要考虑程序子任务间的负载均衡和通信同步开销,编程难度大。数据流编程模型作