论文部分内容阅读
目前,大多数孤立点检测算法仅仅考虑了数据集本身,而没有考虑数据集所蕴涵的语义知识。本文我们通过分析隐藏在Web日志中的语义知识来进行孤立点检测,提出了一种基于语义的孤立点挖掘方法。该方法基于Web日志中记录的各个项满足的数值关系来分析其中隐含的语义信息,并根据这些语义信息的重要性给出一个综合衡量其相关性的指标。实验结果表明,该方法是可行的、有效的。