Web使用挖掘研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:nimakule119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web使用挖掘研究通常被认为包含两个研究方向,本文的主要研究内容—MD模型属于根据日志数据的特点,建立新模型,实施数据挖掘。 MD模型以马尔科夫模型和有向图为主要的理论依据,研究内容主要分为两个部分:模型建立和预测算法。MD模型的建模算法将训练数据在宏观上按照网站的结构图(有向图)进行重新部署,图中的每个结点存储了经过该结点对应的页面的所有访问轨迹,该建模算法实现了训练数据按照一定的规律初步、有序排放,避免了其他模型建模过程中反复扫描训练数据、大量存储冗余信息,从而导致耗时、耗费存储空间的问题。MD模型的预测算法在训练数据分块、规律存储的基础上,只需扫描局部数据,构造与马尔科夫模型相同的预测模式集合,从而达到与马尔科夫模型等价的预测能力。 从理论上分析,MD模型在建模过程中的时间复杂度、模型的空间复杂度、预测算法的执行时间复杂度、预测的准确度上具有较好的综合性能,后续的实验将MD模型与包括马尔科夫模型在内的3个其他研究模型相对比,同时对MD模型进行了改进实验,得出的结论是MD模型预测准确度等价于马尔科夫模型,复杂度更为合理,具有更好的模型调整灵活性。
其他文献
随着计算机技术和网络技术的迅速发展,Web已经发展成拥有几亿用户的巨大分布式信息空间,而且这个数字仍在快速的增加。因此,如何快速准确地从浩瀚的信息资源中寻找到所需的信
周转材料其定义是:在施工生产中能经几年或多次使用而仍保持其物资形态,其价值随使用年限或使用次数转移到产品成本中去的耐用消耗材料.如跳板、模板、脚手架等.周转材料在施
下一代万维网可以支持机器自动处理网络信息,被称为语义网.其关键技术在于通过提供一套通用的,无二义的元数据(memdata)标注网络信息,这套元数据被称为本体(ontology).目前万维网
美国私立大学不管是在教育、科研、社会服务,还是文化传播等各方面都取得了令世人瞩目的成就。长久以来,众多的美国私立大学都在社会和学术各个领域拥有至高的声誉。值得我们
我喜欢踯躅街头巷尾,捕捉最能反映社会问题的形象瞬间。街头是敞开着的社会之窗。这里,正确的,谬误的;积极的,消极的;公开的,隐蔽的,可谓五颜六色,百态千姿,无奇不有! 若选
目前,高等院校的高级语言教学中普遍存在着学生多教师少的问题,将程序设计和程序调试的经验进行总结构建教学专家知识库,研制开发辅导学生上机的教学专家系统有助于教师及时对学
随着计算设备和网络通信技术的不断融合与发展,传统计算环境不能满足日益复杂的生产需要,以瘦终端系统为代表的网络计算模式在上个世纪被提出后便得到了广泛的应用。当前云计算
湖北省企业电视研究会第三次常务理事会于6月15日至17日在宜昌召开。会议讨论了企业电视研究会1989年度的工作。会议认为,企业电视已成为我回广播电视网中一支不可忽视的力
过程控制系统广泛应用于企业生产过程中,是其他企业信息系统生产过程数据的来源。各种过程控制系统一般由不同的提供商采用不同的技术开发和维护,运行在不同的平台上。这导致
质量是高等教育的生命线,是高校赖以生存和发展的根基。而实践教学作为培养学生实践能力和创新精神的重要教学环节,其质量的好坏直接影响着高校教学质量的全局。高校重视实践