【摘 要】
:
随着Internet的迅速发展,网上信息飞速增长,人们面对种类繁多的各类信息,却缺乏有效地自动获取信息的方法。本文针对传统的推送技术存在的忽视用户需求、推送信息针对性不强
论文部分内容阅读
随着Internet的迅速发展,网上信息飞速增长,人们面对种类繁多的各类信息,却缺乏有效地自动获取信息的方法。本文针对传统的推送技术存在的忽视用户需求、推送信息针对性不强和获取用户信息需求不智能、不及时的弊端,以Web挖掘技术为基础,对智能主题推送中的关键技术展开研究,最终实现了综合风险智能主题推送系统。主要研究内容包括:1.对Web日志挖掘预处理过程进行研究。分析了预处理各个步骤的目的和方法,并对相关步骤进行了改进,实现了数据清洗、用户识别、会话识别、路径填充和事务识别各步骤并给出了相关算法描述。2.对模糊k-均值聚类算法进行了改进。深入研究了k-均值聚类算法和模糊k-均值聚类算法,对传统模糊k-均值聚类算法进行了去除空簇的改进,并通过实验比较,验证了改进算法的有效性。3.提出了一种根据用户主题兴趣度构建用户访问矩阵的方法。进行用户访问模式挖掘时,对传统基于用户浏览兴趣度构造用户访问矩阵的方法进行了改进,提出了一种基于用户主题兴趣度矩阵构建用户访问矩阵的方法。该方法有效地解决了用户访问矩阵的稀疏性问题。使用改进的模糊k-均值聚类算法实现用户聚类,提高了用户聚类结果的准确性。4.采用基于改进的模糊k-均值聚类的协同过滤推送算法,对目标用户根据所在的用户兴趣度相似群进行相似性计算。依据计算的预测兴趣度生成推送集,有效地解决了协同过滤推送算法中存在的矩阵稀疏性、冷启动和自动化推送等问题。5.设计并实现了一个综合风险智能主题推送系统,提供风险行业的智能主题推送服务,具有良好的智能性、主动性。本课题得到了“十一五”国家科技支撑计划重点项目——“综合风险防范(IRG)关键技术研究与示范”(2006BAD20802)支持。
其他文献
关联规则的研究是数据挖掘中的重要研究内容之一,由于实际的数据是随时间变化而获得的,因而有必要对其时态属性进行分析,这样有助于揭示事物发展的本质规律,使得发现的知识更具有
物体分类,其实质就是以计算机的角度识别出图像或者视频中所包含物体的类别,如台灯、椅子等。近年来,由于智能移动设备的大范围普及和网络技术的快速发展,数字图像的数量每天
由于业务过程的变化,很多以前开发的系统己经越来越不能满足新的需求而成为遗留系统。但这些系统仍然具有相当重要的业务价值,需要对它们进行软件再工程。传统的软件再工程开
目前,市场上商品假冒伪造现象严重,但传统防伪方法不能完全满足防伪要求。短信数字防伪技术,是目前国内最先进的商品防伪技术,是借助先进的移动通信技术和移动信息终端,并采用加密
在社会经济大系统中,证券投资组合已成为金融管理和投资决策的重要组成部分。马柯维茨以证券投资收益率的方差作为组合证券风险的度量,开辟了金融定量分析的时代,并在此基础上建
J2EE作为现今最流行的分布式计算平台,已成为基于Web的企业应用系统的核心。但多层的J2EE体系结构在提高软件重用性和降低问题复杂性的同时,也使得代码庞大,层与层之间的控制
聚类是重要的数据挖掘技术,在海量数据统计、网络分析及医学图形图像自动监测等领域具有广泛的应用背景。聚类就是根据数据的内在特性将数据对象划分到不同的组(或簇)中,使得
目前,并行计算技术是计算机研究的一个热点。在各种并行系统中,机群系统以其显著优势已经成为高性能计算领域的一种主流平台。结点处理能力的不断加强使得内部结点机之间的通信
随着Internet的普及和全球化程度的提高,为降低产品的开发成本和提高开发效率,产品设计正由传统的串行工作向支持并行工作转变,从孤立模式向协同模式转变。计算机支持的协同
图像配准是数字图像处理中的一个重要的研究方向,也是计算机视觉和模式识别领域中的一项重要的研究课题,图像配准已经在军事、航天、模式识别、遥感监测、医学图像处理等方面