论文部分内容阅读
迅速发展的社交网络在积累了大量数据的同时,也实时产生着可观的增量数据。一方面,社交网络大数据的独特数据特征导致传统信息搜索算法已经难以满足用户的需求。另一方面,社交网络信息的数据多样性对社交网络大数据获取与处理提出了更高的要求。在此背景下,提高在线社交网络搜索算法的准确性与搜索方式的高效性已经成为了研究热点。本文完成的主要工作如下:(1)提出了一种基于E-RSCNN(Extraction-Reinforcement Search Convolution Neural Network)的数据感知与抽取算法。采用了基于深度卷积神经网络的社交网络内容筛选,完成了对安全内容的感知与抽取。将安全内容短文本与微博文档集合分别定义为微博搜索的查询与候选集,根据微博文档的文本与图像特征进行分析,获得了微博文档相关评价。(2)提出了基于深度学习的社交网络多模态内容映射与识别方法(M-RSCNN)算法。该算法结合微博内容中包含的原始图像信息,对文本特征进行修正融合,从而获得内容一致语义空间。将微博短文本与图片信息、时间信息、空间信息组合成的微博文档集合,输入到训练完毕的卷积神经网络模型中,在卷积计算和池化计算等非线性变换后,生成对应微博特征表达的语义空间,得到映射与识别的结果。(3)提出了一种基于深度强化学习的的微博文本匹配与搜索算法(RSDQN)。将微博搜索进行了场景抽象,重新定义动作、反馈等强化学习概念。通过强化学习网络模型计算微博单个文档的得分,并根据图片模态的进行修正。根据得分的相对大小,决定当前微博文档是否列入到当前整体搜索结果,并实时计算整体搜索结果的归一化折损累计增益值(Normalized Discounted Cumulative Gain,NDCG)。将获取到的单个结果得分与整体搜索结果得分返回输入到强化网络模型中,通过重复学习、自我迭代实现搜索网络的自我更新,完成匹配排序与搜索。(4)实现了在线社交网络的多模态安全内容分析与搜索系统,完成了对在线社交网络的多模态安全内容的分析与搜索。系统共分为三个功能模块:在线社交网络多模态大数据内容感知与抽取模块、基于深度学习的社交网络多模态内容映射与识别模块、基于深度强化学习的社交网络内容匹配排序与搜索模块。实现了各项功能完备、操作友好的系统。