论文部分内容阅读
用户信息行为分析从20世纪50年代开始至今一直都是信息服务机构关注的热点问题之一。而在数据呈爆炸式发展的今天,随着数据环境、互联网形式的变化,它不再单纯是信息服务机构独有的服务模式,而是渗入人类社会的各个领域,应用范围延伸至用户需求与用户行为关联的各个层面,研究深度也已经扩展至关联深度挖掘的多重方向。 但随着互联网产业迅速发展,在用户需求服务意识不断强化的现实背景下,该领域理论模型的研究、方法研究与目标实现的匹配程度仍然存在一定距离。“大数据”本身随机、分散、多样化、价值稀疏的属性,使得普遍的数据统计分析已无法满足大数据时代信息价值的提升。从知识服务等应用角度看,依然是基于用户兴趣结构的资源对应性服务,面向用户独立兴趣展开,呈现出断点式、静态性、无针对性的特点;从研究方法角度看,依然基于关键字、词频统计、共词分析的模型,对于用户兴趣关联及发展过程缺乏指向性作用;从知识管理与组织角度看,刻画用户知识模型缺乏由点及面的过程,缺乏针对用户兴趣随时间的推移而表现的用户兴趣的概念漂移与变化趋势的研究。 基于这样的环境前提,本文从大数据应用的视角,对用户信息行为进行知识解析和组织,对现阶段知识服务、知识挖掘、知识推理、用户监测等领域进行了深度剖析和理论分析,建立不同知识组织方向上的用户信息行为解析模型,并通过规范分析和实证结合的方法进行了研究论证,主要获得了以下结论: (1)指出用户信息需求到信息行为的驱动效应及用户信息行为研究框架。用户信息行为的产生受用户需求驱动,对用户信息行为的分析研究可以有效定位用户的直接需求。因此,我们由浅入深提出大数据环境下用户外在信息行为模式研究、知识关联分析及行为监视的进阶式研究框架。 (2)提出精细化知识服务理念及模型。从对用户需求的变化现象入手调研,深入发现了用户信息行为的变化状态,一类是时间轴进程中的知识链化需求,称为绝对变化;一类是因研究过程中的新增问题使原有的知识需求发生的需求漂移,称为相对变化。进而提出“以面对面”基于动态变化的特征搭建动态贴合模型,即在同一目标下,用户需求变化形成需求空间,再以合适的知识组织方式建立相对应的知识空间,依据知识空间对应用户二维化的知识需求空间,形成需求面与知识面的对接,完成了用户需求的知识化定义。 (3)深入搭建知识关联挖掘模型。构建知识点—知识簇—知识空间(网络)的有效路径,从词语概念相似集聚、领域本体扩散发展以及隐性行为关系指引三个方面入手建立知识关联变量,具体实现方法分别为通过术语相似度算法进行概念集合、采用统计理论对时间上具备相邻条件的隐性关联术语进行统计整合以及通过共词分析方法对具备空间相邻条件的术语进行本体关联扩散定义。该知识关联挖掘模型在关联判断、关联强度、关联密度以及关联形式上均打破了传统方法的局限。 (4)搭建动态知识兴趣空间模型。提出描述用户兴趣的知识关联架构,从用户知识范畴的获取与定义、知识关联挖掘及用户知识需求演化推理三个阶段来逐步实现动态挖掘,测度用户兴趣随时间的推移而表现出的知识变化趋势。从兴趣术语集合定义、多粒度词簇生成以及用户兴趣演化表达的角度,搭建用户兴趣的动态进化模型,以解决用户信息需求的延展与时序变化,提高用户兴趣分析方法的科学性和有效性。 (5)构建用户监测领域的预测模型。用户研究范围的预测强调新的需求的获取并进入,从用户的数字足迹视角中发现新空间知识实体,丰富用户的知识空间范畴,优化用户研究方向的路径预测。数字足迹与趋势推演的提出更加丰富了用户信息行为的预测空间,使得人类知识结构复杂、模糊的局限得以有效规避,随着用户知识需求不断的发展和变化,获得预测推演的研究发展路径,它将为知识组织和知识创新领域奠定更准确和及时的对未来目标的预测能力,更高效地提高信息服务的可靠性和智能性。 本文通过分析当前用户信息行为分析的技术和方法,总结现有问题,提出多个大数据应用背景下的用户信息行为解析模型。结合知识挖掘与演化推理等手段,对用户需求进行知识化、有序化和再生等知识分析处理与知识组织研究工作,以期能够在大数据信息网络环境背景下更好地探索以用户为中心的个性化服务模式,为数据全生命周期服务的各个环节提供理论依据和现实参考。