基于局部敏感哈希的隐私保护实时服务推荐

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:wohaishixinyonghu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤算法是服务推荐系统中最有效和应用最广泛的推荐方法,其侧重于提高推荐结果的准确性.然而,在大数据背景下,用户行为数据不仅经常频繁更新而且数据规模增长迅速,传统的协同过滤算法需要穷举搜索所有数据,相似度计算耗时较高,推荐效率低,无法满足用户实时体验的需求服务.快速从大数据中获得高质量的推荐服务成为一种新的需求,为此,提出基于局部敏感哈希技术的协同过滤算法,算法过滤了绝大多数不相似的项目,避免了冗余的相似度计算,另一方面算法将用户行为数据哈希为二进制哈希编码,进而保护用户隐私.最后,在不同规模尺寸的数据集上与主流算法对比,实验表明提出的算法在效率和准确度间能够取得较好的折衷.
其他文献
在科技迅速发展的时代,人们不断地接触新事物和新技术来提高自己,因此,网购成为了最受大家追捧的生活方式之一.论文以电商平台的商品为研究对象,提出了基于用户推荐算法的研究与改进.论文主要研究的是UserBased协同过滤推荐算法,此算法的优点是可以实现跨领域、惊喜度较高;同时也存在着不足之处,比如,推荐结果的个性化比较弱、较为宽泛.通过对物品比用户多、物品时效性较强这种情景进行实验,多方面进行分析,实验结果表明,与传统算法进行比较,论文所研究的UserBased推荐算法,在个性化推荐以及推荐的准确度方面有了较
为了应对大规模网络环境下日益复杂的网络安全威胁,越来越多的研究使用机器学习算法来建立入侵检测模型,其中一些基于随机森林的检测方法具有较好的效果.但传统随机森林中一些分类能力较差的决策树的存在,以及入侵检测数据集的不平衡性,都可能会导致基于传统随机森林的入侵检测模型的性能有所下降.针对这些问题,论文在基于传统随机森林的入侵检测模型上加入了精英选择、加权投票和上采样几种优化方法,并在UNSW-NB15数据集上进行了测试,结果表明优化后的模型具有更好的检测能力.
社交网络谣言转发行为是指用户是否转发特定谣言.以往研究主要针对的是谣言在群体中的传播规律,鲜有针对个体传播行为的研究.基于信息传播理论,研究首次提出两类谣言个体转发影响因素的框架:谣言发布者以及谣言内容对个体的影响力.研究使用NLP相关技术和复杂网络分析算法等技术计算出相关特征;最后使用常见分类算法进行预测用户是否转发谣言.基于数据的实验结果表明,论文提出的算法可以有效提高预测谣言转发的准确性.
为了提升表面肌电信号(sEMG)手势动作识别的准确性和训练效率,提出一种基于LightGBM的手势识别模型.传统的GBDT算法训练效率较低,准确率无法快速提升,LightGBM算法采用基于梯度的单侧采样和互斥特征捆绑改进性能,具有训练速度快、占用内存低、分类准确率高的优势.将臂环采集到的8通道sEMG数据按时间顺序进行扁平化处理,提取有效特征.实验结果表明,经过LightGBM改进的sEMG手势识别模型取得较高准确率,并且显著提升训练速度.
人工电场算法(AEFA)是受库伦定律和运动定律启发而发展起来的一种新型启发式算法.在整个搜索过程中,个体位置变化是基于步长计算的,步长依赖于一个常数,即引力常数(K).AEFA算法中采用指数函数来计算常数K(t).较大的引力常数可以增加AEFA的探测能力,较小的引力常数可以提升AEFA的开采能力.然而这种指数变化使得K的大小随着迭代次数的迅速的递减,会使AEFA的搜索能力快速变弱,使得AEFA在早期阶段对整个搜索空间的搜索不充分,从而导致搜索结果不是最优的,为了提高算法的探索能力,论文提出一种新的引力常数
为了解决面向公共领域的语音识别(Automatic Speech Recognition,ASR)在识别电力巡检专有指令时识别率低的问题,提出了基于模型匹配的电力巡检语音识别后文本纠错算法.首先对庞大的电力巡检指令词库进行预处理并构造电力语法模型,建立电力词汇间的联系,然后对该模型下的电力词汇构建汉字和拼音AC自动机(Aho-Corasick Automaton,ACA)分别进行识别串精确匹配下的查错和纠错,最后针对精确匹配下纠错失败的问题设计模糊匹配算法,进一步实现语音识别后文本的模糊纠错,从而优化了电
如果突然刹车、拐弯或出现故障的异常车辆能够及时地向后续车辆发送EWM(Emergence Warning Message,紧急报警信息)则可增加司机的反应时间,大大降低连环碰撞车祸的发生概率.因此,近年来车辆碰撞协同预警系统的研究受到广泛关注,为了提高EWM的传输距离,通常采用多跳广播式协同碰撞预警,传统的多跳广播很容易产生广播风暴,尤其是在车辆密集及多辆危险车辆并存的条件下,更容易造成大量EWM的传输失败或传输延时增大,从而增加连环碰撞发生的几率.论文提出了协同碰撞预警协议可以减少EWM的碰撞,从而降低
由于支持向量机(Support Vector Machine,SVM)在高维度、非线性等情况下仍具有极高精确性故而被广泛应用于地形识别领域研究.在复杂的地形环境以及数据的不平衡等环境下,SVM可能会因为缺少较强的鲁棒性导致分类结果并不理想.论文以提高复杂地形环境下分类算法精确度为目的,在研究了深度信念网络(Deep Belief Network,DBN)[1]与支持向量机(Support Vector Machine,SVM)的基本理论并进行有效结合后应用于地形识别领域.算法大致为将地形图片通过初始构建的
当前交通道路中,存在许多有毒尾气排放超标的车辆,严重污染空气、损害人体健康.目前黑烟车辆检测多采用人工方法或者基于手工特征提取的传统机器学习方法,耗力耗时且难以全面实时监控.论文率先将基于卷积神经网络的目标检测框架CenterNet作为视频监控交通场景下黑烟车辆检测的基本解决方案,并针对实验结果进一步改进上述结构,提出基于注意机制的双分支黑烟车辆检测网络,使用双主干网络提取有针对性的特征表示,对于双主干网络的特征融合引入注意机制.实验结果表明,在黑烟车辆数据集下的AP达到黑烟92.53、车辆97.84,相
针对现有情感分析模型将卷积神经网络(CNN)和循环神经网络(RNN)建模分离的状况,论文提出了一种基于双向长短期记忆网络(Bi-LSTM)和CNN相结合并带有注意力机制(Attention)的文本分类模型.模型先获取上下文语义特征,再融合局部语义特征,同时对每一时刻的特征信息给予多个不同权重关注.实验表明,该模型可以有效地增强分类语义特征的捕获能力,比使用单一神经网络或者它们的任意两两组合,该模型不论在训练速度还是在预测准确度方面都有很好的改善.