Web使用挖掘技术的研究

来源 :西安交通大学 | 被引量 : 0次 | 上传用户:Lincon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以Web使用数据为基础,采用数据挖掘技术研究Web使用数据的序列模式识别、客户划分、网页划分、站点优化和个性化服务等问题.并将这些实际问题抽象为Web使用挖掘系统构筑、用户浏览模式挖掘、用户事务和网站URL聚类,Web浏览预测、用户测览兴趣迁移模式等五个Web使用挖掘论题.在使用挖掘系统构筑方面,提出了一个基于CORBA的分布式Web使用挖掘系统——DiWUM,它基于Web,采用CORBA技术进行分布式处理,在Web服务器端、代理服务器端、应用服务器端和客户端进行分布式数据采集.另外,它能够满足一些挖掘结果的实时表示的要求.另外,该文还提出了用户浏览兴趣迁移模式的挖掘,它借鉴Web内容挖掘的结果,将Web页面按主题矢量进行表示,进行页面聚类.然后将用户事务中的页面替换成相应的聚类号.最后进行序列模式挖掘,挖掘出来的就是用户测览兴趣迁移模式.如将每个聚类用最大的主题来表示,就可以直观、容易地理解用户浏览兴趣的迁移情况.
其他文献
在荧光显微成像中,为了避免荧光分子失活并长时间观察细胞活动,通常需要采用低剂量荧光染料,此时相机捕捉到的图像也会伴随着明显的噪声。此外采用传统方式所获取的点扩散函数(Point Spread Function,PSF)可能会存在误差,并不能直接用于解卷积去模糊。本文研究在未知准确的PSF前提下,基于正则化的半盲复原以及基于深度学习的图像盲复原方法来去除图像中的噪声和模糊,并最终成功应用于宽场和结构
聚类分析是无监督学习方法里最常见的研究方向,且在电子商务中的商品推荐,新闻及短视频中的信息分发等领域上有非常广泛的应用。随着大数据时代的到来,聚类所面临的数据集,无论是在样本数目还是数据维度方面规模都越来越庞大,导致单一的聚类算法开始变得难以适用,因此,借鉴了集成学习思想的集成聚类算法便应运而生了。论文在研究过几类基于不同理论的集成聚类算法的原理后发现,针对集成聚类算法的不足,如未考虑到数据样本到
医疗大数据指的是个人因疾病、门诊、住院、体检、健康活动及医院日常管理所产生的海量数据。医疗大数据的发展与人们的生活息息相关,具有重大的战略意义,而在这些数据中的医学影像数据作为非结构化的图像数据,其传输、存储和检索操作无法通过常规方法实现,整合这些功能的系统就是医院的PACS系统。随着国内对于医疗卫生的日益重视和国家的大力投资,PACS系统已经应用到所有医院的信息化管理中。在PACS系统中,医学影
帕金森病(Parkinson’s disease,PD)是一种常见的神经系统变性疾病。冻结步态(Freezing of gait,FoG)是对PD患者威胁最大的运动障碍,主要表现为行走中突然出现步行中断,此时患者躯体仍保持行进中向前倾斜,极易跌倒,导致伤残或死亡。因此,探索有效的FoG检测方法,是一项极为紧迫的重要课题。本文以24名PD患者为研究对象,针对数据集构建、特征提取与优化、分类算法等Fo
学位
在全社会集中力量推动产业升级的大背景下,发展高端制造业成为时代的迫切需求,作为加工制造设备核心组件的伺服系统的控制性能是制约加工水平的关键因素。伺服系统常以永磁同步电机作为控制对象,但由于电机自身非理想的结构特点和逆变器里的非线性因素的影响使得电机输出转矩存在明显脉动,这导致伺服系统控制精度降低,限制了国产伺服在高精尖制造领域的应用。基于提高电机输出转矩平滑性的目的,本文就永磁同步电机转矩脉动抑制
学位
学位
学位
MicroRNA是一种广泛的存在于真核生物中的小分子非编码RNA基因。它的长度通常在19至25个碱基之间。成熟的MicroRNA是由其发夹前体(Pre-MicroRNA)发展形成的,因此具有较高的保守性,MicroRNA通常针对转录后水平调控的靶基因进行表达。这类小基因能够参与发育、代谢、抗病、逆境胁迫等多种生物途径,并起到非常重要的调控作用。对MicroRNA深入的研究有助于更好的了解生物的基因
玉米是世界上种植最广泛的谷类作物。在我国,玉米的种植面积和总产量仅次于水稻和小麦,居第三位。近年来,由于农业生产水平的提高、作物品种的更换、生态环境的变化以及耕作方式的改变,玉米病虫害发生面积和危害程度随之呈现加重趋势。基于传统信息技术的农作物病虫害识别方法,需要针对病虫害类型精心设计提取特征,具有较高的复杂性以及专业性,消耗大量人力资源,严重影响了计算机技术在我国农业领域的快速普及。因此,急需挖
学位