一种重构网站结构的Web日志挖掘数据预处理方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:purplerain9112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在Web日志挖掘的过程中,数据预处理是整个Web日志挖掘过程的基础,其直接影响了日志挖掘的质量和结果.由于目前大多数网页都采用框架模式,而传统的预处理技术并没有针对frame页面进行过滤,即使过滤,也会导致页面结构的混乱,从而不能够为路径补充提供正确的信息.基于此,本文提出一种基于重构网站结构的web日志挖掘数据预处理方法以及基于它的路径补充方法.
其他文献
《伊势物语》和《诗经》分别是日中古典文学的代表,具有很高的研究价值.而《筒井筒》和《卫风·氓》作为其中的代表作,在刻画女性形象具有很多相似之处,却在不同的社会背景下
研究结果表明,郑单18上中部叶片夹角小,下部叶片夹角大;叶绿素、蛋白质、可溶性糖含量高,过氧化物酶活性高,丙二醛积累少,叶片功能强,衰老慢;叶面积系数大;灌浆时间长;千粒重
基于不同的考虑,给出了体能测试安排的3个模型.模型Ⅰ,对体能测试的5个项目依据随机服务系统理论,得到每名学生测试完成的平均等待时间;模型Ⅱ,根据SAS系统Proc Univariate过
通过对网页用户角色的分析发现,传统的基于PageRank算法的搜索引擎结果排序欠佳,是因为其没有兼顾所有角色对网页重要性的评价.为此,提出一种结合了所有角色评价的综合网页排
面对市场鱼龙混杂的养生类图书,就出版部门而言,如何根据新闻出版总署在《关于加强养生保健类出版物管理的通知》中的要求,如何提升识别能力,如何发挥自我审查职能,通过提高
高校学生思想政治教育工作是高校人才培养的重要内容之一,刚性教育与柔性教育的矛盾、灌输式教育与参与式教育的矛盾、惩处式教育与包容式教育的矛盾所带来的“管理悖论”不
架空线–电缆混联输电线路发生故障时,单端故障行波难以辨识,无法直接用以定位故障点。为提升单端量测距的实用性,提出一种基于故障距离区间的混联输电线路单端行波故障测距方法
目的 了解9个省级独立职业病防治机构1999至2008年国内发表的论文情况.方法 自行设计调查表对9个省级独立职业病防治机构的论文产出力和影响力进行分析.产出力以发表论文、影
针对配电网检修的对象选取主观性强、可靠性评估采用历史平均数据等问题,提出基于状态监测的配电网可靠性检修选择模型及算法。根据设备状态监测量与故障率的关系,建立了以检修
"80后"、"90后"大学生成长在各种思潮相互交织、多元价值观相互碰撞的时代,受社会环境和社会观念的影响,他们的价值观、人生观和伦理道德观等呈现出鲜明正面负面交织、积极消