基于网页标记和词组的用户建模技术

来源 :广西大学 | 被引量 : 0次 | 上传用户:bluebabyyejing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展和Internet中信息的迅速增长,个性化服务日益受到广大用户的青睐。作为个性化服务的核心技术,用户建模也逐渐受到研究者的重视。用户兴趣建模技术作为个性化服务的核心问题,主要是研究如何有效地组织用户的兴趣源,用户兴趣的表示、更新、存储以及计算。本文比较系统、完整地分析和论述了用户建模中的各项技术,总结了用户模型的表示方法,分析了用户建模的信息来源,并对用户建模技术进行了归纳和分类。论文首先围绕建立用户个性化模型的关键技术进行研究,这些技术包括WEB挖掘、用户模型的表示、机器学习等。在介绍了相应的背景知识后,针对网页文档的特殊性,论文提出一种基于网页结构特征的用户建模技术。它通过对某些网页标记内的词汇人为提升词频数,将提取到的网页结构特征加入到用户模型的计算中。然后,论文又提出一种基于词组的用户建模技术,将词组引入用户模型的表示中。实验结果表明,基于网页结构特征的用户建模技术和基于词组的用户建模技术都能建立更有效的用户模型。
其他文献
计算机网络性能是衡量计算机网络运行状态的各项指标的综合。计算机网络因其发展的高速度和各自为政的研究体制,以及兼容性等诸多问题,出现了一些和总体发展趋势及未来需求不
日益泛滥的垃圾邮件,既浪费用户时间、消耗了网络传输资源以及邮件服务器存储空间,也是病毒、僵尸网络等恶意代码的策源地。目前,应对垃圾邮件的主要方法和技术手段有很多,其
板书是对教学内容的加工和提炼,是一份“微型”教案。正确把握教学内容的重点和难点是上好每一堂课的基础,也是有效保证教学质量的前提。如果教师能够围绕教学重难点精心设计好
随着信息技术和电子产品的发展,嵌入式Linux系统已经广泛用于生产生活的各个方面,许多基于嵌入式Linux的硬件设备均需要一个高效率、可扩展的GUI。嵌入式Linux环境下,GUI的整
随着电信技术、IP网络的发展,人们对于新业务的需求的增加,使得传统PSTN(Public Switched Telephone Network,公告交换电话网)网络呈现出网络结构复杂,与IP网络难以融合,新业
电子政务是政府信息化建设的重点工程,在我国的电子政务建设规划中明确指出要加大力度进行政府门户网站建设。目前我国电子政务门户网站建设还没有统一的技术标准和构建平台,
网络技术的高速发展,使网络应用渗透到了国民生产及国家安全的关键领域,但是在网络通信的同时,出现了大量的网络攻击,对信息系统造成了巨大破坏,使网络安全技术成为了各国政府和研
随着互联网以及通讯技术的飞速发展,以互联网为基础的新型舆情传播媒体逐渐代替传统媒体,成为人们获取与传播舆情信息的主体。由于互联网的实时性、高效性,舆情信息往往呈爆
《肿瘤影像学》杂志自1992年创刊以来深受医学界赞颂,1998年经原国家科委、中央新闻出版总署批准为国内外公开正式发行的期刊,刊号:ISSN 1008-617X,CN31-1793/R。杂志由优质
网站防篡改系统是在互联网迅猛发展的大潮中出现,并伴随着网站安全性需求的深入不断发展起来的,但是由于采用技术和架构方面的滞后,目前此类系统都存在一定的限制或缺陷。在