基于Web内容和日志挖掘的个性化服务研究

被引量 : 0次 | 上传用户:listsetmap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的普及和信息技术的快速发展,传统的Web信息获取方式由于其通用的性质,不能满足不同兴趣、不同访问目的用户的需求,从海量的网络信息中有效地获得个性化信息已成为人们迫切的需要,因此,个性化服务技术越来越受到广泛的重视。个性化服务是通过收集和分析用户信息来学习用户的兴趣和访问行为,从而实现主动推荐的目的。本文重点对个性化服务技术中的Web挖掘技术进行了研究,结合Web内容挖掘和Web使用挖掘给出了一种整合挖掘的方法,并设计了一个Web挖掘策略来验证这个挖掘方法的性能。挖掘策略采用一种基于Web内容和Web日志的整合挖掘方法对网站用户访问模式进行自动分类,本方法通过抽取网页文字内容的信息项获得网页主题信息,结合Web服务器日志文件建立用户访问模式描述文件,来分类用户访问模式和预测用户未来的访问请求。根据分类任务和预测任务的结果评价整合挖掘方法的有效性。挖掘策略的实施包含以下部分:用户访问会话识别,整合Web内容挖掘和Web使用挖掘,构建访问模式描述文件,分类和预测。采用两个度量值评价整合挖掘方法的性能:分类精确度A(C)和预测精确度A(P)。实验结果表明,对比单独进行一种Web挖掘的方法,整合挖掘的分类精确度和预测精确度有较大提高,这种方法可以更好地促进Web个性化推荐。本文结合大连市公安局“网上作战系统”的实际课题,根据基于Web内容和日志的整合挖掘方法,设计了一个提供个性化服务的刑侦信息推荐系统,介绍了离线和在线部分的模块处理,描述了针对不同用户提供个性化信息推荐的过程。系统的设计目的是通过信息的主动推荐提高相关刑侦信息获取的速度,从而起到一定的辅助快速分析、得出案件侦破信息的作用。
其他文献
贾政是《红楼梦》中的一个重要人物,对此人的评论,多从名上说起,有假正经、假政、假真等说法。在传统中国,名和字在意思上是有联系的,评论者大都纠缠于贾政其名,而忽略其字。本文将
通过大量的文献查阅,并进行整合,将心理挫折定义为:是指人们在从事有目的的活动中,遇到了难以克服或自以为无法克服的障碍或干扰,致使个人需要或动机无法满足时所产生的紧张
文章对藏山风景区森林资源做出评价,分析当地森林资源目前存在的问题,提出有效保护和利用藏山风景区森林资源的措施,促进藏山森林旅游业得到可持续发展。
研究背景与目的磁共振弥散加权成像(diffusion-weighted imaging,DWI)是一种观察活体组织中水分子微观运动的成像方法,其宏观表现用表观扩散系数(apparent diffusion coeffic
综合运用调查法等研究方法,对安徽省8个地市的32所高校的体育场馆课余运营现状进行调查,并运用管理学的SWOT分析法进行分析。认为高校体育场馆具有资源丰富、价格适中等优势;
通领科技海外官司胜诉的消息,犹如一针强心剂,令中国企业精神大振。让更多在自主创新上孜孜以求的企业有了继续前行的动力。
清洁生产是通过对生产工艺的不断改进,选择清洁能源、清洁设备、清洁原料,通过对生产工艺的改进优化和有效的管理,不断提高资源的利用效率,减小生产造成的环境污染,消除对人类健康
2008年1月1日《中华人民共和国劳动合同法》实施后,离职后劳动者的保密义务与竞业禁止问题成为倍受业界关注的一个焦点。在分析现行法律关于竞业禁止的适用范围、经济补偿金
<正>目前,低压电器市场随着电力设施的建设而逐步扩大,近几年来国内外低压电器需求普遍处于扩张状态,市场前景十分可观。然而,国内低压电器企业普遍缺乏足够的自主创新能力,
<正> 官窑制度是中国古代制瓷业发展史中的一个特殊现象,官窑制度的实质是封建帝王凭借政治特权无偿占有优质陶瓷制品。官窑制度的形成,可以上溯到唐代越州的“贡窑”,即专门