关联规则挖掘中若干关键技术的研究及其在专利信息挖掘中的应用研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:lingyuehqu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是解决数据丰富而知识贫乏的有效途径,是信息科学领域的前沿研究课题之一,有关的研究和应用提高了决策支持的能力,成为数据库研究中一个富有应用前景的领域。数据挖掘已经在诸多领域有广泛的应用并解决了许多商业问题,取得了良好的社会效应。 本文描述了数据挖掘的概念、功能以及发现模式的分类。在数据挖掘算法中,关联规则挖掘是数据挖掘领域中的重要研究内容。传统算法在生成关联规则时,存在着生成规则的效率低、生成的关联规则之间存在着大量的冗余,或挖掘出的规则的支持度和置信度都很高,但却是无趣的、甚至是虚假的规则。本文在研究了现有数据挖掘的基础上,结合专利文献挖掘的需求提出了一种新的算法FP-VNRARM (Frequent Pattern Valid and Non-Redundant Association Rules Mining),该算法采用经典FP-Growth算法的一种改进形式实现方式,首先消除基于同一个频繁项集的简单冗余规则,在此基础上二次挖掘,消除不同频繁项集间生成严格冗余规则,并引入相关度的概念,最终挖掘出的规则有效并无冗余。实验证明FP-VNRARM算法是有效可行的。 在数据挖掘技术的应用方面,本文面向专利文献挖掘应用的实际需求,分析了专利文献的应用及其用途,研究了专利技术、专利文献的自身特点,以及专利文献蕴涵的丰富的技术信息、法律信息和商业信息,寻找将数据挖掘技术应用到专利文献中的途径。最后以江苏省镇江市光电子领域专利信息平台为主要背景,将数据挖掘的方法和知识理论应用到实际系统中,采用FP-VNRARM实现了在专利信息的关联规则挖掘,并为今后的专利信息挖掘工作提出了几点建议。
其他文献
Internet技术的发展为人们提供了方便快捷的信息获取手段。面对网络上的海量信息,人们有时往往会感到无所适从。如何为每个用户提供快捷准确,满足个人实际需要的信息,己成为
随着注册商标数量的急剧增加,在这种超大图像库上实现检索将需要耗费大量的时间和人力。传统的商标图像检索方法存在很多缺陷,包括图像的人工分类耗时、带有主观性、自动化程
Packing问题大量地出现在机械制造、皮革服装、造船、交通运输、航空航天、大规模集成电路的设计等诸多领域。求解Packing问题在科学研究和生产实践中均有重要意义。典型的长
基于自然手势的交互方式具有广泛的应用领域,是未来人机交互的主要方式之一。本文的基于视觉的手势识别主要包括:手势分割、手势特征提取、静态手势识别、动态手势识别。其中
随着互联网的高速发展,各种新的网络应用不断涌现,网络带宽的需求不断增加。P2P技术为核心的多种应用占用大量网络带宽,网络拥挤不堪,用户希望了解流量构成,识别网络中各种流量。
随着计算机视觉技术的飞速发展,如何获得富有真实感的场景三维模型日益受到人们的关注。传统基于设备的三维重建方法成本较高,且其使用范围有局限性,因而在实际应用中受到限
随着数字技术的飞速发展,后PC时代涌现出众多嵌入式多媒体产品,同时,网络的普及又刺激了数字媒体内容的不断增长,数字家庭产业由此进入了高速发展期。在深入分析国内外研究概
数字水印技术作为信息安全技术领域的重要分支,得到了广泛的研究。它通过在不引起人类感知的情况下将一种不可见的标记嵌入到多媒体信息产品中,用以标识原创作者对作品的所有
网络时代,人们可以轻易地收集大量的包含个人隐私信息的数据。在将这些数据发布以进行科学研究或者数据分析前,需要对这些数据进行匿名处理以防止个人敏感信息泄露。如何防止具
皮影戏是我国一项历史悠久的艺术文化,然而随着时代的变化,这项传统艺术在逐渐没落,这是我们大家难以接受的。为了改变这一点,许多有志于保护国家非物质文化遗产的科学工作者