面向公共安全的电信数据仓库及数据挖掘技术研究与实现

来源 :同济大学 | 被引量 : 9次 | 上传用户:tianxu36966688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对公共安全的需要,对电信数据仓库和数据挖掘技术进行研究。重点应用聚类分析和神经网络算法,通过对异常点的查找,从电信数据中挖掘出特殊用户群。首先,进行数据仓库体系架构的研究,以CDR(呼叫详细记录)为源数据,通过ETL形成可供数据挖掘的基础数据。对数据挖掘中分类、聚类、关联、序列等分析方法开展研究,重点对对神经网络算法开展研究和试验应用。其次,采用改进的CRISP-DM数据挖掘流程,按照业务理解、数据理解、数据准备、建立模型、模型评估和模型发布这六个商业应用数据挖掘步骤,通过对数据进行分析和使用相关的挖掘工具clementine,以外来人口分析为例建立相关目标用户预测模型。然后,将这些模型应用,对模型的效果进行评估、验证,查找可能存在的目标用户。最后,关于下一步工作方向进行了简要的讨论。本文以外来人口分析为例,通过使用由CDR而衍生的主叫时长、长途比等衍生变量,对一个地区的移动电话用户中的外来人口进行预测,取得比较满意的效果。使用clementine数据挖掘工具,应用Kohonen神经网络算法,采用了改进的CRISP-DM标准、数据取样和衍生变量的正确使用是本文的研究得以实现的基础。
其他文献
咳嗽变异性哮喘(CVA)是哮喘的一种特殊类型,为儿科临床常见疾病。中医学对本病的理论及临床研究均尚处在初始阶段,关于其病机及证治的探讨可谓众说纷纭。本研究从中西医两个领
有关莎士比亚戏剧的评论已经有几个世纪的历史了,许多评论家提出了自己独特地评论观点。但是,这并不意味着随着时间的流逝以及社会的迅速发展,莎士比亚戏剧就不再会有新的解
本文从性质上把文学意义分为语言意义 (指意 )和人文意义 (蕴意 )两个方面 ,其中人文意义为主要方面。文章认为 ,文学意义是作者赋意、文本传意和读者、批评家释义的复合共生
《四溟诗话》又名《诗家直说》,明代谢榛(1495~1575)所作。谢榛,字茂秦,临清(今属山东)人,当后七子结社之初,曾以布衣执牛耳,后为李攀龙等所排斥,削其名子七子之列。谢榛论诗
本文回顾了英语世界庄学研究的总体情况。认为至 1 980年前后 ,英语世界庄学研究才真正走向成熟。近百年来的英语世界庄学研究给我们留下了很多宝贵的财富 ,出现了象华生、梅
<正>浓缩着岭南地区传统建筑风格、民风乡情的岭南印象园,用她独有的视觉和趣味地玩乐,为岭南人重现了本土的民俗文化和市井百态。让我们重温渐已淡忘的岭南风情……
中国古代文学的文体系统是一个天然形成的有机体。这个系统自成一体而相对完满自足。系统内的每一种文体都具有独特的表现功能,这种功能的独特性是该文体产生的前提和存在的
包装材料对保证药品的稳定性起着至关重要的作用,与人们的用药安全直接相关。药品包装材料选用不当会导致药物活性成分的迁移、吸附甚至发生化学反应,使药物失效,有的还会产生严
本文主要阐述分子标记在林木辅助选择育种中的应用。利用多种分子标记(RAPD,RFLP,AFLP,STS,SSR,STR等),可以在林木早期生长阶段对一些性状进行鉴别,构建单种分子标记遗传连锁图谱或几种分子标记共存的混合连