面向行为大数据的数据挖掘技术

被引量 : 0次 | 上传用户:lixin200513137149
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代下,社交网络的兴起和便携式移动设备的出现为实现对线上线下行为表现的实时记录提供了可能。通过自动化的数据获取手段,我们能够得到实时、海量、多态、真实的行为数据,这是研究者观察和预测个体或群体心理行为特征与规律的宝贵资源。借助数据挖掘技术和机器学习算法,能够有效地发挥隐含在大数据中的关联性价值,更加全面、客观、高效地从数据中挖掘出内隐的心理特征与行为规律,拓宽和加深心理学研究的广度和深度。本文从计算机学科角度,主要介绍基于大数据进行心理学研究中所可能涉及到的一些数据挖掘技术,包括数据挖掘的基本流程以及典型的计算建模方法。特征提取和模型构建是数据挖掘的两个重要步骤。在特征提取部分,我们提出基于深度学习算法构建无监督的特征学习模型,实现从复杂、多态的行为数据中高效地提取出能够客观、准确、全面表征行为规律及特点的数字化向量。在建模部分,线性回归模型、SVM模型、聚类模型等都可被用于心理特征预测,并已取得较好的结果。本文将从概念、原理、应用三方面介绍分类和预测的一些典型算法。此外,报告中将介绍一个公开的数据挖掘工作平台WEKA,它集合了大量能够承担数据挖掘任务的机器学习算法,包括数据预处理、分类、回归、聚类等常用算法。清晰简单的交互式界面为心理学专业背景的研究者提供了想要利用大数据或数据挖掘算法进行相关分析及研究的便利。
其他文献
随着国内外贸易形势的不断变化,综合型外贸人才越来越受到追捧,从而对国际贸易实务课,一门具有涉外性、实践性强的综合性应用学科提出了更高的要求。从现代信息技术着眼、从
近年来随着综合国力的发展以及对国家治理能力要求的不断提升,新公共管理作为一种理论亦或实践在国内都倍受推崇,成为公共管理研究领域的热点。尽管新公共管理为政府改革注入
<正>汉水,又称汉江,是长江最长支流。自陕西西南部发源,流经汉中盆地和陕西南部,入鄂后,自丹江口进入平原,水势平缓,与长江之间河港纵橫交错,形成我国著名的粮仓一江汉平原。
会议
当前,人民检察院在我国行政诉讼中的法律地位十分尴尬。检察机关有权对行政诉讼实行法律监督,是我国行政诉讼法所确定的一项基本原则,但这一原则目前在实践中面临着一系列的
【正】 《红楼梦》庞大的形象体系构成了一座巨大的金字塔。宝玉、黛玉、宝钗在宝塔中各自占着显赫的位置,贾母、王夫人、王熙凤也在宝塔中各自占着高层次的位置。他们在庞大
供应链协同管理过程中的信息不对称主要源于两个方面,一是信息供给的不对称,二是信息认知的不对称。随着供应链发展日趋完善,架构日趋复杂,系统性更强,供应链环节中的不稳定
目的:观察腕踝针治疗痛经的临床效果。方法:将56例痛经患者作为治疗对象,应用腕踝针针刺踝关节周围的相应点,观察评定其治疗效果。结果:治愈46例(82.14%);显效8例(14.29%),好
林区道路作为林业生产的基础设施,是实现林业现代化、林业经营集约化的基础,也是森林可持续发展不可缺少的基本条件。通过对林区道路现状、存在问题的分析,提出今后林区道路
建设部、国家文物局日前公布了第五批中国历史文化名镇名村名单,建德市大慈岩镇新叶村和浙江省另外9个镇村一起名列其中。此次新叶村获颁全国历史文化名村称号,是新叶
为了满足龙滩水电站施工用电及河池电网供电的需要,本文提出架设百龙滩至车河第三回220kV电源线路;为避免电网重复建设,建议在天峨县城附近至龙滩方向改选龙滩220kV变电所所址,并