基于阈值限制法的个体行为轨迹分析

被引量 : 0次 | 上传用户:zeuswugeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个体的日常行为轨迹历程具有一定的重复性和确定性,对这些行为模式进行研究,可以描述一个人的行为特征,并预测其在不久将来的行为,这对于研究评估社交网络人口之间的联系起着至关重要的作用。人类行为预测以及应用在众多领域均被广泛使用,尤其在人人快递等众包系统中。本文将人类行为预测问题转换成分类问题,即已知用户一天中的历史记录,判断其是否会前往某一固定场所。对行为分类的经典算法,例如SVM、决策树、神经网络等算法,缺少对数据的过滤和筛选,以至于在进行算法参数反演的时候,习惯于使用全体数据作为输入数据。但是通过数据分析可知,并不是所有的数据都适合作为输入样本,因而我们这里试图对行为数据的可训练性进行评估,使用了两个评估测度。基于这两个测度,对个体的行为数据进行筛选和过滤,抽取出能够代表整体数据集的样本作为接下来算法的训练数据集合。在这种背景下,本文给出一种阈值限制的方法来分析个体行为轨迹。本文所使用的数据集由100多位受试者的数据组成,每位受试者的数据还包含了50多种属性,这样的数据是很庞大的,所以有必要对数据集进行预处理。本文主要使用数据规约中的属性子集选择方法对数据的属性进行筛选,对不完备不可靠的数据进行过滤,对与文章目的无关或者弱相关的属性进行删除,得到与本文目的相关的、有意义的数据。在进行完数据规约后,对筛选出来的属性还需进一步分析处理。本文将与位置信息直接相关的属性通过设置活动值进行分析整合,得到算法可以直接进行处理的数据,从而在运行算法处理数据时能够更快的得到结果同时也能使结果更准确。阈值限制法通过对数据进行两次过滤处理,在每次过滤处理的过程中加入阈值,这样能够筛选出高质量的样本节点,从而为下一步的预测模型提供优质的训练数据样本。当筛选出高质量的样本节点后,本文运用人工神经网络对筛选过的样本节点进行预测,可以发现当设置合理的阈值时,尽管合理数据降到原来的20%左右,但是数据的可预测性从71.2%提升到95.9%。在实际场景中,可以根据需要进行阈值设置,满足实际需要。实验结果表明阈值CloseTime和PositionChange的设定对提高算法的预测准确率有非常明显的效果。
其他文献
被子植物的起源是有关生物进化的重大、悬而未决问题之一,本文一反传统的陆生植物单元起源的观点,倡导三元起源论,由此探讨陆生植物、裸子植物、被子植物的起源,提出演化阶段
<正>全面从严治党是以习近平同志为总书记的党中央作出全面建成小康社会、全面深化改革、全面推进依法治国、全面从严治党"四个全面"的战略部署之一。基层党组织作为党的执政
随着知识时代的到来,特色企业文化构建已经成为了提升企业竞争力的重要途径。特色企业文化的构建已经不再局限于无意识构建或总结提炼的层次上,必须基于企业自身特征、生命力
<正>人人都希望自己有红润而光洁的面容,因为它不仅给人以美感,而且也使自己精神愉快,有益于身心健康。但是,有些人脸上却有许多褐色的雀斑,且这种现象女性比男性多。那么有
期刊
<正> 员工与企业的关系就像一场婚姻,只有建立在互相欣赏、共同进步基础上的关系才能持久,任何一方的成长或退步都可能使某一方抛弃另一方,令婚姻解体。所以,人才问题是很多
<正>每年农历五月初五,是我国传统节日——端午节,又称为端阳节、天中节。我国传世的古代名画中,以"端午"为主题的为数不少,于尺幅之间,描绘了独具特色的端午节传统民俗文化
[英]/Whitmer RA…//JAMA.-2009,301(15).-1565~1572既往曾报道,急性低血糖发作与1型糖尿病患儿认知功能受损有关。然而在2型糖尿病老人中,其低血糖发作与痴呆间关系迄今尚未
目的主要是为了能够对自身免疫性肝病,简称AIH病症以及原发性胆汁性肝硬化以及两种病症的重叠综合征临床情况与特征进行综合分析。方法具体针对全部46名病患的肝活检病理情况
小额贷款公司作为对金融市场的重要补充成分,对促进经济发展起到了重要作用。但在以往对其发展的研究中,多为微观个体的分析,很少有从宏观层面涉及全国范围的基本情况研究,而