中俄经贸合作网个性化服务的数据预处理研究

来源 :对外经济贸易大学 | 被引量 : 0次 | 上传用户:sony360
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,Web中提供的信息越来越丰富,但是Web站点及信息数目的增多,导致用户寻找信息困难,这就促进了提供一对一服务的个性化服务系统的出现。个性化服务的实现需要借助Web数据挖掘技术。一般来说,Web挖掘分为四个子任务:资源搜索、数据预处理、模式发现和模式分析。预处理是Web挖掘任务的一个重要阶段,也是工作量较大的一部分,数据预处理的质量直接关系到数据挖掘结果的好坏。Web挖掘的针对性强,对于不同领域,数据预处理、模式发现和模式分析等过程的处理也不完全相同。目前,具体到针对个性化服务的数据预处理研究方面,研究大都停留在对启发式规则的简单应用,而没有结合相关的领域知识。尤其是在会话识别中,一般根据设定的阈值进行“一刀切”式的处理,会话识别的精度不高,从而影响了后续对用户访问习惯的挖掘。本文着重对个性化服务所基于的Web数据挖掘技术中的数据预处理过程进行研究。在研究过程中以中俄经贸合作网个性化服务所需的Web挖掘数据形式为目标,通过改进现有的启发式规则,进行系统建模、数据结构设计、程序流程设计等,使用编程语言最终实现了一套Web日志数据预处理系统。该系统将数据预处理的过程-数据清洗、用户识别、会话识别等功能封装起来,增加了数据预处理过程的可重用性,使得在进行进一步个性化研究时更加快捷、方便。同时,在SQL SERVER形成了一个可供进一步进行个性化服务研究的数据挖掘库。在如何能高效地应对更大数据量下的日志处理,如何在不影响效率的前提下更加精确地识别用户和会话,以及如何在预处理过程中更好地利用好领域知识等方面,需要进一步的研究。
其他文献
在21世纪,企业正处在一个以模糊的组织机构边界和时变的市场走向为特点的环境变化中。企业急需一种合适的决策支持系统的辅助来应对这些变化的挑战,传统商业智能系统是在原有
高校作为当前我国新一代接班人的人才培养基地和诞生基地,灌输中华民族上下五千年的优秀传统文化对学生的成长成才有着不可代替的作用,并且,优秀的传统文化也需要学生进行传
为研究开发一种反应速度快、降解效率高的挥发性有机物处理技术,本文采用VUV/O3协同氧化体系,对甲苯、苯乙烯及间二甲苯等挥发性有机物的降解进行了研究。具体研究内容如下:(1
与以往廉租房、经济适用房的概念不同,本文认为保障房建设可以成为国家中长期经济增长新的引擎,而并非是消极应对民生问题的权宜之计,国家应该取消此前的廉租房和经济适用房
两种语言转换过程中的不对等性使得很多译者感到很困惑。由于语言本身、文化、历史、地理、宗教等方面的差异使得汉英翻译的过程中两种语言的对等是相对的,不对等是绝对的。
非物质文化遗产是中华优秀传统文化的重要组成部分,蕴含了丰富的文化资源,与高职教育具有先天的亲和性。本文以南通科技职业学校为例,介绍了学校在立足本土文化资源和结合校
目的:失恋是亲密关系的结束,前人认为它总是与各种负面情绪相关联,在某种程度上可被认为是压力事件。本研究探讨"情绪"在失恋者身上扮演何种角色。实验一:为明确失恋者以何种
设计与思考是设计师在构思一件新事物时,必要的两种能力。新问题的出现,往往要在思考中寻求解决的方法。在设计中,思考是对设计作品的塑造、创新。处在不同时代背景下的设计
顿悟的记忆优势效应是指顿悟相对于非顿悟能够成产生更强的记忆,早在1926年,科勒就在大猩猩的实验中发现顿悟获得的问题解决方案在以后情境能够较少的再尝试错误并熟练运用。
本文对近5年针灸治疗肩周炎文献,分别从毫针刺法、穴位注射、拔罐、电针、小针刀、刮痧、艾灸、穴位埋线、穴位封闭等方面予以归纳整理,分析表明不同的针灸疗法治疗肩周炎各