论文部分内容阅读
千禧之年,革放鼎新,信息技术浪潮席卷全世界。从PC机到笔记本,从固定电话到智能手机,从闭路电视到虚拟现实头盔,人们无时无刻不被数据浸润着,物理自然与人类社会已经悄然融入数字自然界之中。然而,人类认知水平和认知能力的提高却极为有限,远不及技术发展和数据膨胀的速度,不断增长的数据与有限的认知能力之间形成尖锐矛盾,信息过载问题越来越受到关注和重视。作为继搜索引擎之后兴起的新星,个性化推荐系统通过向用户提供更具针对性的服务而有效缓解了信息过载问题的影响。从被动等待用户输入检索词,到主动了解用户需求,个性化推荐系统在解决用户信息过载问题上具有与生俱来的巨大优势,被广泛认可。通过较为全面和系统的文献综述,本文揭示出当前个性化推荐系统存在的主要问题在于高质量用户偏好数据的匮乏与种类多样的推荐算法之间的矛盾,实乃"巧妇难为无米之炊"。用户偏好乃个性化推荐系统之基,当前用户偏好获取存在两个方面的不足:一是基本数据分析来源的用户评分、评论和标签等标注行为发生频率非常低,容易产生数据稀疏问题;二是日志分析粒度太粗,毕竟日志分析以单页为基本单元而用户在特定网页并非均匀浏览而是不同部分有不同的侧重,从而无法具体得到用户更为精准的偏好信息。因此,本论文从用户日常发生频率最高的浏览行为入手,利用心理学眼动实验证明屏幕视觉热区的存在并探究其影响因素,借助屏幕视觉热区可将用户实时注视的网页内容进行抓取并析出关键词作为用户偏好数据的基本来源;继而,采用自组织聚类方法将所有偏好数据完整映射至即时偏好、短期偏好和长期偏好三层结构之上;此外,对用户评论与评分不一致的现象进行了修正,意图使用更为真实客观的评分与评价信息向用户呈现推荐的原因;最后,以用户为中心,通过对用户与推荐系统交互行为的观察及用户即时、短期及长期偏好的充分利用,提出交互收敛式个性化推荐算法进行实时推荐,力图确保推荐精确性的前提下提高推荐的多样性,从而有效提升个性化推荐系统的可用性、易用性及用户满意度。总体而言,本论文以用户为中心,着眼于解决用户信息过载这一本质性问题,通过解决个性化推荐系统现存顽疾而实现推荐系统中用户个性化更为精准识别的突破,进而采用更加实时和互动性的算法为用户进行准确而多样的推荐。文章主要内容如下:第1章绪论。介绍本论文的研究背景、主要概念、研究目的、研究内容、研究方法、主要创新点及其理论与现实意义。第2章个性化推荐系统研究综述。按照认知论、方法论和矛盾论的逻辑线索对个性化推荐系统的当前研究现状进行了梳理,介绍了个性化推荐系统满意化研究及外围相关研究的进展,并指出个性化推荐系统面对的五大根本矛盾。第3章用户为中心的个性化推荐系统理论体系。主要包括个性化推荐系统的历史背景及相关理论、目的、类型、本质、特征维度及其发展瓶颈。第4章基于屏幕视觉热区的用户偏好提取方法。通过眼动实验证明屏幕视觉热区的存在并进行验证。屏幕视觉热区受网页类型影响,因此使用双中线法消除噪声的网页自动分类算法,并据此提出了短文本关键词实时提取技术。第5章基于屏幕视觉热区的用户偏好复合模型。以提取屏幕视觉热区的用户偏好数据为基础,构建融合即时、短期和长期偏好的用户偏好复合模型。对模型进行形式化描述和验证,提出基于属性的商品自组织层次聚类方法和基于兴趣的用户会话切分算法为模型实现提供算法支撑。第6章基于在线商品评分修正的推荐解释。在线商品评论是用户重要的参考,直接影响用户最终购买意愿与购买行为。本章利用功能语言学中的评价介入理论构筑分析体系,利用话语标记理论构建语料库,设计在线商品评分修正方案并确定本文的推荐解释风格。第7章基于屏幕视觉热区的交互收敛式个性化推荐方法。以用户即时偏好为基础,以加权的用户短期和长期偏好以及其他情境因子为约束条件,引入人机互动模式实现对用户的引导,从个性化推荐系统与用户的实时互动中进行个性化推荐,通过不断叠加约束条件而迅速收敛到用户满意的结果范围。第8章总结与展望。总结全文的主要研究内容和创新性贡献,指出本研究的局限和不足之处,继而对未来研究方向和研究路径进行较为详细的说明。本研究的创新之处主要体现在:理论上,明确指出个性化推荐系统的本质不是算法而是认知助手,构建了推荐内容(What)、推荐策略(How)、推荐解释(Why)和推荐时机(When)的H3W个性化推荐系统理论体系,以及综合即时偏好、短期偏好和长期偏好的用户复合偏好模型。方法上,首先,借助心理学实验发现了屏幕视觉热区,并据此从用户实时浏览行为中提取用户即时偏好,在基于双中线法消除噪声的网页自动分类算法和短文本关键词实时提取方法的基础上,实现了用户偏好的实时提取;继而,通过基于属性的商品自组织层次聚类方法和用户会话切分算法,从海量即时偏好数据中提炼用户短期和长期偏好;再次,引入功能语言学中的评价介入理论构筑分析体系,利用话语标记理论构建语料库,确定在线商品评分修正方案及推荐解释风格;最后,以用户历史行为、偏好复合模型、即时交互行为为约束条件,开发原型系统测试并验证了交互收敛式个性化推荐方法,与传统推荐方法相比本文方法不仅具有更高的精确性和用户满意度,还能有效解决推荐算法实时性差、未登录用户偏好提取难等问题。