【摘 要】
:
网络大数据中与Web用户行为相关的数据,例如在线点击数据和通讯记录等,为人们深度挖掘和定量分析人类兴趣动力学带来了机遇,这些在线行为数据被称为大数据时代的"小数据",有
【机 构】
:
中国人民大学信息学院,西北师范大学计算机科学与工程学院,新疆财经大学统计与信息学院,中国互联网络信息中心互联网基础技术开放实验室
【基金项目】
:
国家自然科学基金项目(61379050,91224008,71261025);国家“八六三”高技术研究发展计划基金项目(2013AA013204);高等学校博士学科点专项科研基金项目(20130004130001);中国人民大学科学研究基金项目(11XNL010)
论文部分内容阅读
网络大数据中与Web用户行为相关的数据,例如在线点击数据和通讯记录等,为人们深度挖掘和定量分析人类兴趣动力学带来了机遇,这些在线行为数据被称为大数据时代的"小数据",有助于揭示许多复杂的人类社会与经济现象.Web用户行为建模时常见的前提假设就是人的行为符合Markov过程,用户下一行为仅依赖于当前行为,与过去的历史行为无关.然而,在线用户行为是一个复杂过程,常常依赖于人的兴趣,对于人类兴趣动力学的本质规律目前知之甚少.利用中国互联网络信息中心提供的30 000多名在线用户行为记录数据,基于块熵理论对在线用户行为进行分类研究,通过信息论分析方法,结合熵增曲线的离散导数和积分理论,分析在线用户点击行为的随机性和记忆性特征.研究表明,与常见的假设不同,Web用户的行为并不是一个简单的Markov过程,而是一个符合幂率的非周期无限长程记忆过程;进一步还发现,用户在线连续点击7个兴趣点,其行为的平均预测增益就可达到95.3%以上,可为大数据时代在线用户兴趣精准预测提供理论指导.
其他文献
研究了感应耦合等离子体质谱(ICP MS)测定超痕量钚时的质谱干扰及干扰元素的去除;建立了环境水样中超痕量钚的测定方法。方法所用的解吸液适于ICP MS直接进样,并有效地消除铅
以活性Al2 O3为吸附剂 ,采用吸附型大体积水样采集装置浓集水中钚 ,用HNO3 NaF溶液浸出钚 ,最后分离纯化。在 10 0L自来水中加入 5 0× 10 - 3 Bq/L2 39Pu时 ,全程放化回收
积分兑换提倡利用角色扮演、组内竞争的方式激发学生的学习兴趣,通过任务积分化、材料积分化、规则积分化的方式让学生主动参与学习,应用积分兑换提高约束力,落实课堂评价。
“门辟九霄,仰步三天圣迹;阶崇万级,俯临千嶂奇观”。这是崆峒山南天门上的一幅楹联,它用绝妙的语言高度赞誉了崆峒山的高雄奇观。
“Peaks nine heaven, step by step thre
<正>一、给学困生一颗"热心"以爱心作为教育出发点,学困生的心理更敏感、更脆弱,更需要别人的关爱。有些老师常常忽略被贴上"差生"标签学生的感受,认为他们头脑简单、反应迟
新昌县是绍兴都市圈的南部副中心,该县是中国名茶之乡,拥有丰富的茶文化资源。在当前审美经济时代,文章通过对发展新昌茶文化旅游的相关要素分析,设计了新昌茶文化旅游产品类
我国作为一个多民族国家,民族和谐是保证国家大局稳定的前提。2018年我国对《宪法》作出了修改,在宪法序言中指出“平等、团结、互助、和谐的社会主义民族关系已经确立,并将继续加强”,在社会主义民族关系中增添了“和谐”的主旨。民族和谐事关国家的统一与社会的稳定发展,对族籍权益保护进行研究,有利于保障各民族的利益,使得各民族更加和谐地相处,从而顺应“和谐”主旨的要求。但目前我国在族籍权益保护方面的立法并不
当前,全社会走向“互联网”时代,办公室工作也由传统的工业化思维转向互联网思维.办公室的接待工作不再停留在简单的迎来送往的层次上,而是上升为企业看似被动、实则主动的一
用同位素稀释 α谱法测量了土壤中2 39,2 4 0 Pu。以2 4 2 Pu作稀释剂 ,用三正辛基氧膦 (TOPO) /甲苯溶液萃取 ,草酸反萃 ,水相制备α源 ,用低本底α谱仪测量钚同位素的α能