基于显露模式的早期网瘾行为检测模型的研究与实现

来源 :东北大学 | 被引量 : 2次 | 上传用户:wcs_ly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的日益普及,社交网、购物网、即时聊天软件也随之蓬勃发展,但由于患者对互联网依赖而导致明显的心理异常并造成生理性受损现象,这就是网络成瘾问题,即“病理性网络使用”,英文为Pathological Internet Use,简称PIU。如何早期发现和治疗网瘾是学术界和工业界面临的前沿问题。目前,对于此问题的研究大多基于心理学、社会学和医学等方向,而计算机技术领域尚未涉及此问题。因此,本文从计算机数据挖掘角度对网瘾问题进行了研究,提出了基于显露模式(Emerging Pattern-EP)的网瘾模式挖掘和检测模型,为进一步有效治疗网瘾提供了可参考的理论依据。显露模式是一种新的对比挖掘模式,是从一个数据集到另外一个数据集支持度发生显著变化的项集,其能够捕获目标类与非目标类之间的差异化特征,基于显露模式可以建立分类效果良好的分类器。在网瘾模式挖掘和检测模型中,首先需要采集用户上网行为简单事件,然后通过生成规则推理出具有高级语义信息的复杂事件,最后根据行为等价类(Behavior Equivalence Class)挖掘出产生子(Generator),因为产生子能显著的代表数据集的属性特征且表示形式简单。本文提出了两种PIU模式检测算法,基于产生子的PIU检测算法(Generator-based PIU Detecting Algorithm-GBP DA)和基于EP的PIU检测算法(EP-based PIU Detecting Algorithm-EPBPDA). GBPDA算法从产生子角度,选择能显著代表网瘾行为的产生子,通过对网瘾数据集产生子与测试数据集产生子比对打分方法给出最后诊断。EPBPDA算法则从EP角度出发,挖掘出跳跃显露模式(JEP)与基本显露模式(eEP),综合考虑增长率、支持度、JEP与EP提出一种有效打分机制,并利用该机制对网瘾进行检测。从真实数据集和仿真数据两种数据集进行实验,分别检验了两种算法的性能指标,如运行时间、内存资源占用情况;有效性指标,如正确率、误诊率、率。实验结果表明,当数据规模不大时,两种方法都有很好的网瘾检测效果,且EPBPDA算法的有效性好于GBPDA算法,这是因为EP区分能力强于Generator。但性能指标GBPDA算法好于EPBPDA算法,原因在于挖掘EP比Generator需要更多的处理时间和空间。当数据规模较大时,相比于GBPDA算法,EPBPDA算法的有效性优势更加明显,同时由于EP个数没有Generator个数增加的多,导致运行时间也比GBPDA算法更少。
其他文献
南水北调东线工程输水调蓄湖泊的水环境污染治理对调水水质目标的实现是极其重要的,而南四湖是南水北调东线工程的重要输水信道和调蓄湖泊,所以对南四湖流域水环境质量的调查和
词汇教学是大学英语教学的重点。从当前大学生词汇学习的现状来看,大多数学习者没有掌握正确的词汇记忆策略,能够主动运用词汇记忆策略的学生更少之甚少。因此,从词汇学和图
三价铬(Cr+3)是动物机体所必需的一种微量元素。而且参与葡萄糖耐量因子的活性组成,铬可以增强胰岛素的功能,进而作用于胰岛素信号通路,提高机体的糖耐受能力,从而调节机体糖
<正>为什么要建设长江经济带?建设长江经济带对中国经济稳增长、区域协调发展和转型升级有怎样的意义?中国经济发展新引擎"要改善民生、实现中国梦,中国经济必须保持一定的速
我国60岁以上的老龄人口已经突破2亿,并将较长时期保持持续增长的态势。面对日益严峻的人口老龄化问题,现行的城市规划、交通设施设计和公交服务系统主要是针对通勤交通的需
随着新一轮的课程改革的大力推进,《义务教育历史课程标准(2011年版)》(文中简称《标准》)于2012年由中华人民共和国教育部正式颁布。在《标准》第二部分课程目标的“知识与
沼气是微生物在厌氧条件下发酵有机质形成的一种可燃性气体,是多种气体的混合物,主要成分为甲烷(CH4)约占50%-75%,二氧化碳(CO2)约占20%-45%,其余为硫化氢(H2S)等。沼气中占
房地产代理行业是产生房地产附加价值的重要行业,它是国家监管部门、房地产开发商、广大服务商和消费者之间的纽带,是国家重要经济产业的组成部分。随着近几年全市房地产市场的
非法证据排除规则通常指执法人员及其授权的人员通过非法的方法所收集的证据不得在刑事审判中采纳。非法证据排除规则主要功能为遏制侦查机关非法取证行为和保障刑事被告公平
条件价值评估法(Contingent Valuation Method, CVM)是目前国际上评价生态资源环境服务及物品最广泛的方法。双边界二分式选择问卷是目前最有效的CVM问卷格式,双边界二分式选