复杂数据分类方法及其在个性化推荐系统中的应用

被引量 : 0次 | 上传用户:aonHdt6b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,人们已经累积了海量的数据,并且数据量仍在持续地呈指数增长趋势快速膨胀。为有效开发和利用这些数据,支持社会、经济、生活所需,以数据挖掘为代表的商务智能技术得到了广泛的应用。分类已经成为数据挖掘中应用最为普遍的方法。随着商务智能在管理中的应用普及,面向海量、高维等复杂数据的高性能分类方法,已成为数据挖掘、知识发现领域中的热点及难点问题。本文针对数据挖掘中的复杂数据分类问题,对基于关联分析和子空间划分的分类方法展开了进一步的研究。第一,针对商务数据规模普遍较大的特征,提出了一个基于关联分析的关联分类方法。首先,定义了一种新的分类规则度量标准——典型性(Typicality),该标准综合考虑了规则的覆盖度及置信度,有效避免了传统支持度-置信度度量框架下无效规则的产生。其次,提出了一个三阶段的规则剪枝策略,在保持分类准确率的前提下能够有效缩小分类器的规模。UCI数据集上的实验结果表明,本文提出的关联分类方法在显著降低分类器复杂性的同时,也获得了更好的分类准确率。第二,关联分类方法能够很好地处理大部分分类问题,然而在处理具有高维属性特征的数据库时具有一定的局限性。针对商务数据中的高维数据挖掘问题,提出了一个基于核Fisher鉴别分析的子空间分类方法。该算法结合了频繁模式挖掘和核Fisher特征抽取技术来寻找所有子空间,利用分治策略将大样本的分类问题转换成一系列小样本的子空间分类问题,再通过特征抽取技术进行降维,从而大大降低了问题的复杂性。实验结果显表明,本文提出的子空间分类方法能够有效处理高维、大样本数据的分类问题,相较于其他分类方法可获得更好的分类准确率。第三,本文将所提出的关联分类方法应用到个性化推荐系统中,构建了基于分类的个性化推荐系统理论模型。
其他文献
<正>提问一:博鳌亚洲论坛、"博鳌方案",对中国、亚洲乃至世界带来的影响是怎样的?魏建国(中国国际经济交流中心副理事长兼秘书长):在过去的十多年中,博鳌亚洲论坛不仅团结了
咳嗽为临床常见病症,以外感咳嗽居多。风寒咳嗽代表方止嗽散应用临床200多年来疗效显著,但是对于其治法的理论研究较少,同时止嗽散合方治疗咳嗽病的规律研究不足。本文从文献
TC4钛合金具有比强度高、耐蚀性强及生物相容性好等优点被广泛用于航空航天、医疗器具及能源化工等行业。而硬度低,耐磨性差等因素限制了其应用范围。针对以上问题,本课题采
针对深部地层钻井过程中遇到的高温、高矿化度等问题,以AM、AMPS、DMDAAC、DMAM、SAS为聚合单体,采用氧化-还原引发体系进行水溶液共聚,合成了一种五元共聚物降滤失剂。通过
随着卫星导航技术的迅速发展,基于卫星导航技术的应用已经深入到日常生活的诸多领域,在军事领域的应用也越来越广泛。为了适应用户需求,需要GPS接收机能在信号受到多路径效应
中国的五大国家中心城市先后提出建设金融中心的发展目标,但与世界上成熟的金融中心相比,差距还较大。而金融集聚是建设金融中心的基础,因此本文研究中国五大国家中心城市的金融
城镇居民收入是我国经济建设中的重要部分,城镇居民储蓄额可以及时反映出城镇居民的经济状况与消费水平,所以研究我国城镇居民储蓄具有现实意义。我国进入9O年代以后,居民储蓄存
全球经济环境恶化,市场竞争也日趋激烈。跨组织的信息互联、业务流程重组、个性化都对信息系统设计也提出新的挑战。可重用的思想及方法为解决这一难题提供了指导方向,即生产或
自改革开放以来我国公路建设事业迅速发展,公路隧道的数量不断增加,建设规模也越来越大。公路隧道的大量涌现,为岩土工程学科的发展带来了新的机遇与挑战。在岩土工程领域尚未完