基于屏幕视觉热区的交互收敛式个性化推荐方法研究

来源 :华中师范大学 | 被引量 : 2次 | 上传用户:qubinai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
千禧之年,革放鼎新,信息技术浪潮席卷全世界。从PC机到笔记本,从固定电话到智能手机,从闭路电视到虚拟现实头盔,人们无时无刻不被数据浸润着,物理自然与人类社会已经悄然融入数字自然界之中。然而,人类认知水平和认知能力的提高却极为有限,远不及技术发展和数据膨胀的速度,不断增长的数据与有限的认知能力之间形成尖锐矛盾,信息过载问题越来越受到关注和重视。作为继搜索引擎之后兴起的新星,个性化推荐系统通过向用户提供更具针对性的服务而有效缓解了信息过载问题的影响。从被动等待用户输入检索词,到主动了解用户需求,个性化推荐系统在解决用户信息过载问题上具有与生俱来的巨大优势,被广泛认可。通过较为全面和系统的文献综述,本文揭示出当前个性化推荐系统存在的主要问题在于高质量用户偏好数据的匮乏与种类多样的推荐算法之间的矛盾,实乃"巧妇难为无米之炊"。用户偏好乃个性化推荐系统之基,当前用户偏好获取存在两个方面的不足:一是基本数据分析来源的用户评分、评论和标签等标注行为发生频率非常低,容易产生数据稀疏问题;二是日志分析粒度太粗,毕竟日志分析以单页为基本单元而用户在特定网页并非均匀浏览而是不同部分有不同的侧重,从而无法具体得到用户更为精准的偏好信息。因此,本论文从用户日常发生频率最高的浏览行为入手,利用心理学眼动实验证明屏幕视觉热区的存在并探究其影响因素,借助屏幕视觉热区可将用户实时注视的网页内容进行抓取并析出关键词作为用户偏好数据的基本来源;继而,采用自组织聚类方法将所有偏好数据完整映射至即时偏好、短期偏好和长期偏好三层结构之上;此外,对用户评论与评分不一致的现象进行了修正,意图使用更为真实客观的评分与评价信息向用户呈现推荐的原因;最后,以用户为中心,通过对用户与推荐系统交互行为的观察及用户即时、短期及长期偏好的充分利用,提出交互收敛式个性化推荐算法进行实时推荐,力图确保推荐精确性的前提下提高推荐的多样性,从而有效提升个性化推荐系统的可用性、易用性及用户满意度。总体而言,本论文以用户为中心,着眼于解决用户信息过载这一本质性问题,通过解决个性化推荐系统现存顽疾而实现推荐系统中用户个性化更为精准识别的突破,进而采用更加实时和互动性的算法为用户进行准确而多样的推荐。文章主要内容如下:第1章绪论。介绍本论文的研究背景、主要概念、研究目的、研究内容、研究方法、主要创新点及其理论与现实意义。第2章个性化推荐系统研究综述。按照认知论、方法论和矛盾论的逻辑线索对个性化推荐系统的当前研究现状进行了梳理,介绍了个性化推荐系统满意化研究及外围相关研究的进展,并指出个性化推荐系统面对的五大根本矛盾。第3章用户为中心的个性化推荐系统理论体系。主要包括个性化推荐系统的历史背景及相关理论、目的、类型、本质、特征维度及其发展瓶颈。第4章基于屏幕视觉热区的用户偏好提取方法。通过眼动实验证明屏幕视觉热区的存在并进行验证。屏幕视觉热区受网页类型影响,因此使用双中线法消除噪声的网页自动分类算法,并据此提出了短文本关键词实时提取技术。第5章基于屏幕视觉热区的用户偏好复合模型。以提取屏幕视觉热区的用户偏好数据为基础,构建融合即时、短期和长期偏好的用户偏好复合模型。对模型进行形式化描述和验证,提出基于属性的商品自组织层次聚类方法和基于兴趣的用户会话切分算法为模型实现提供算法支撑。第6章基于在线商品评分修正的推荐解释。在线商品评论是用户重要的参考,直接影响用户最终购买意愿与购买行为。本章利用功能语言学中的评价介入理论构筑分析体系,利用话语标记理论构建语料库,设计在线商品评分修正方案并确定本文的推荐解释风格。第7章基于屏幕视觉热区的交互收敛式个性化推荐方法。以用户即时偏好为基础,以加权的用户短期和长期偏好以及其他情境因子为约束条件,引入人机互动模式实现对用户的引导,从个性化推荐系统与用户的实时互动中进行个性化推荐,通过不断叠加约束条件而迅速收敛到用户满意的结果范围。第8章总结与展望。总结全文的主要研究内容和创新性贡献,指出本研究的局限和不足之处,继而对未来研究方向和研究路径进行较为详细的说明。本研究的创新之处主要体现在:理论上,明确指出个性化推荐系统的本质不是算法而是认知助手,构建了推荐内容(What)、推荐策略(How)、推荐解释(Why)和推荐时机(When)的H3W个性化推荐系统理论体系,以及综合即时偏好、短期偏好和长期偏好的用户复合偏好模型。方法上,首先,借助心理学实验发现了屏幕视觉热区,并据此从用户实时浏览行为中提取用户即时偏好,在基于双中线法消除噪声的网页自动分类算法和短文本关键词实时提取方法的基础上,实现了用户偏好的实时提取;继而,通过基于属性的商品自组织层次聚类方法和用户会话切分算法,从海量即时偏好数据中提炼用户短期和长期偏好;再次,引入功能语言学中的评价介入理论构筑分析体系,利用话语标记理论构建语料库,确定在线商品评分修正方案及推荐解释风格;最后,以用户历史行为、偏好复合模型、即时交互行为为约束条件,开发原型系统测试并验证了交互收敛式个性化推荐方法,与传统推荐方法相比本文方法不仅具有更高的精确性和用户满意度,还能有效解决推荐算法实时性差、未登录用户偏好提取难等问题。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
资本批判是马克思学说的本质内容,也是马克思对人类思想的主要贡献。深入理解马克思的资本批判的存在论意义,并据此揭示这一批判的原则高度,是把握马克思学说之当代意义的关
可视化语言提供了一种可视、直观与抽象的方式去描述复杂对象的结构与构成的方法,已广泛应用于计算机相关领域。可视化语言研究的最基本问题之一是如何描述可视化语言。与形
以河北省塞罕坝机械林场不同林龄的华北落叶松人工林为研究对象,以Pielou均匀度指数、ShannonWiener多样性指数、Simpson多样性指数和Margalef丰富度指数为指标,在进行结构化
三维显示技术能够给用户带来真实的视觉感受,是当今显示领域的研究热点。近几年来,各大厂商推出了品种繁多的三维显示设备,从显示技术的层面上可以分为戴眼镜式和裸眼式两种
由于电子废弃物产生量大、成分复杂并且种类繁多,其安全处置与资源化成为废弃物循环利用领域的研究热点之一。作为电脑中的存储介质,废旧硬盘和内存存储器是一类典型而又特殊
目的:分析及探讨骨折患者合并肺栓塞的抢救及护理,总结其发病原因,临床表现和治疗护理经验。方法:20例骨折并发肺栓塞的病人根据临床表现等分析其原因,给予氧疗、溶栓、抗凝
媒体数据是指数字化的图像、视频、图形、动画、交互内容等形式的信息载体。媒体处理研究媒体内容的获取、存储,处理、传输、播放或展示等理论和技术。在数字创意、交互娱乐
市场经济下,立法者对于空域的认识仍然局限于国家领空主权这一概念,倾向于依靠行政手段解决空域利用问题,导致空域利用率极低。空域资源的低利用率成为制约民用航空业发展的
公文是各党政机关、企事业单位中常见的政务活动的工具,但从新闻报道的角度讲,公文正是新闻报道的"富矿",我们可以从中寻觅到很多新闻素材。了解二者的联系与区别有助于我们