【摘 要】
:
多关系分类是数据挖掘领域中的研究和应用热点之一。已有多关系朴素贝叶斯分类算法将所有与目标表相连的表都考虑在内,其中包括语义关系很弱的表。为此,本文提出一种新的基于
【机 构】
:
清华大学经济管理学院 北京 100084
【出 处】
:
信息系统协会中国分会第二届学术年会
论文部分内容阅读
多关系分类是数据挖掘领域中的研究和应用热点之一。已有多关系朴素贝叶斯分类算法将所有与目标表相连的表都考虑在内,其中包括语义关系很弱的表。为此,本文提出一种新的基于语义关系优化的多关系朴素贝叶斯分类算法--Graph-NB算法。该算法利用多表之间存在的不同语义关系,对表进行剪裁,以达到优化语义关系图以及消除无关表对分类影响的目的,同时可以提高分类效率。该算法实现了深度优先与广度优先两种不同的遍历策略,通过比较分析与其他算法在多个真实数据库和合成数据库上的测试结果以及两种不同遍历策略的优劣势,可以发现Graph-NB算法分类准确度高,算法运行时间短,优于之前的许多多关系分类算法。
其他文献
电子商务市场规模的迅猛增长对理论和实践的研究提出了更高的要求。本文从回顾电子商务研究文献及其分类框架入手,在中国自然科学基金委指定的管理学重要期刊中,选取了1999至
吾国人民遭受军阀与反动党派的压迫已经三十多年,一旦得到解放,何等可喜。然而看到反动派所干的破坏工作比日本人更加狠毒,真够使我们痛心疾首。此后如何建设复兴,正是全体
为了支持协同商务的发展与推广,信息平台必须要具有支持异构资源动态整合、资源协作等特点。网格技术的本质理念是资源的共享和协作。本文在协同商务信息需求分析的基础上提
针对信任在移动商务发展中的重要性,本文的主要研究目的在于分析影响移动商务消费者信任的因素。本文对移动商务信任研究的文献进行了综述,分析了移动商务价值链模型,采用价
在基于价值的客户细分中,由于错误分类代价差异和不同价值客户数量的不平衡分布,基于总体准确率的数据挖掘方法不能体现由于客户价值不同对分类效果带来的影响。本研究在代价
随着现代技术的发展,支持多用户的群决策系统已经逐渐发展成熟。然而,在多属性决策条件下,针对非结构化问题的模糊性和复杂性,群决策者必须掌握一个定量化的决策方法以解决该
本文基于供应链管理与信息管理的原理,探讨供应链中重要部分信息流的管理问题,通过研究牛鞭效应的表现、原因以及主要的解决方法,介绍了供应链中信息管理的价值,并在最后提出
随着信息技术的进步,处于信息技术和市场营销交叉领域的交叉销售得到了快速发展和广泛应用。作为新兴研究领域之一,交叉销售的理论研究和实际应用日趋成熟,但也面临诸多问题
随着电子商务的不断发展,如何更好地了解用户需求以提供更令人满意的个性化服务变成了一个十分关键的问题,在此基础上电子商务个性化推荐系统就逐步发展起来。文章首先介绍了
伙伴选择问题是创建虚拟企业过程中的关键问题之一。本文在虚拟企业伙伴选择蚁群算法模型的基础上,对蚁群算法和遗传算法进行了比较,阐述了融合的遗传算法与蚁群算法应用于伙