网上银行数据流频繁模式挖掘算法研究及应用

被引量 : 0次 | 上传用户:GPSCMP
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,如何从爆炸性增长与动态变化的海量数据中获取信息与知识,已经成为了企业乃至国家获得核心竞争力的关键。数据挖掘技术就是为了解决这一问题产生的人工智能技术。但是在股票证券交易的欺诈监控、金融转账的风险控制、传感器检测以及信用卡诈骗的预警等应用场景中提出了更高的实时性要求。针对这些应用场景在上个世纪末提出了数据流的概念。与传统的数据库不同,数据流是连续、有序、无限的,并且数据流上的查询具有很高的实时性要求,通常只允许一次或很少次数的扫描。利用有限系统资源对海量的数据流进行快速处理以获取有用信息,为数据挖掘研究带来了新的机遇和挑战。本文针对网上银行数据流频繁模式挖掘及相关技术进行了研究。重点研究了以下几个问题:现有的数据流模型和数据流频繁模式挖掘算法;金融网上银行数据流的结构特点、数据特征及其数据模型研究;改进Lossy Counting算法提高算法的动态性;利用基于散列表的数据流频繁模式挖掘算法MFS-HT挖掘数据流频繁模式;网上银行数据流数据结构,以及频繁模式挖掘系统设计开发等。本文研究内容和创新工作主要包括以下几个方面:首先,对数据流挖掘及其模型等相关理论进行研究,总结出目前该领域的最新研究成果,通过网上银行数据流的研究总结出网银数据流的概念与特征,提出网上银行数据流除了具备数据流的基本特点外,还具备连续性、多义性、冲突性和海量性等特性。结合网上银行数据流特征,提出网上银行数据流时序轮盘模型。然后,研究分析了现有的数据流频繁模式挖掘算法。基于数据流时序轮盘模型,提出TTLC (Time-series Turnstile Lossy Counting)算法提高了Lossy Counting算法的动态性,另外设计并实现基于散列表的数据流频繁模式挖掘算法MFS-HT,并通过实验证明算法的时空效率优于现有算法。最后,本文将上述算法编码实现,集成到了自行设计开发的网上银行数据流频繁模式挖掘系统当中。并使用模拟数据,对系统进行实验分析与研究。实验表明系统具有较高的准确性和时间效率,对上层决策支持具有一定的指导意义。
其他文献
特发性面神经麻痹,此病多见,可发生于任何年龄,而以20-40岁为多,男性略多。任何季节均可发病而春秋两季发病率较高。临床上,特发性面神经麻痹虽然不是致死性疾病,但发病率较
境界论是王国维诗学理论的核心内容,境界论的最终形成经历了由意境到境界再到扩大后的境界论的历时发展过程和由境界论的基本范畴与子范畴共同组成初具体系的境界论的逻辑过
本文通过综合运用文献资料法、调查访问法、问卷调查法、逻辑推理法、数理统计法等多种科研方法,以2009年吉林省青少年篮球比赛为研究对象,调查、访问知名学者、专家多人,通
毛泽东是20世纪中国伟人。他革命一生梦寐以求的理想,就是争取中国人民的独立解放和富裕幸福,实现中华民族的伟大复兴。这就是“中国梦”。全世界都知道毛泽东那句名言:“我
2017年,没有什么比得上投资者对比特币等加密数字货币更关注了,也没有什么比得上对比特币所引起的争议更大了。比如,比特币的价格由600美元左右上涨到12月17日的19694美元,让大量
报纸
巫傩文化与萨满文化是流布于古代中国南北两大地区的原始自然宗教文化,它们都曾属于巫文化范畴,但都有自己的个性特征。论文试图从人类学的角度,对两者在起源、主体、哲学、神话
一般而言,贩卖人口犯罪,是指以剥削或者出卖为目的,用欺骗、利诱、胁迫等手段拐骗、出卖人口的行为,世界文明各国刑法均明文规定其为犯罪。贩卖人口是将“人”作为商品的罪恶
第一部分抗幽门螺杆菌治疗对纠正H.pylori阳性患者缺铁性贫血的系统评价[目的]幽门螺杆菌感染和缺铁性贫血都是全球范围内发病率很高的疾病,造成严重的疾病负担。这两种疾病
宝鸡金旭工矿设备有限公司是一个以生产工矿设备配件为主的企业,其主要客户为有色金属矿山企业,尤其是黄金矿山企业。该公司的产品主要是高锰钢衬板和低铬合金钢球,这两种产
湖泊地区是一个城市景色最优美的地区,其以景观环境,情趣上的优势为城市人群所向往。然而,随着我国近年来城市发展速度的不断加快,城市建设与自然湖泊的矛盾日益突出。在现代