基于概念层次的网络挖掘技术

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:GalaxyJW
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概念层次(Concept Hierarchy)是指将大量的概念用层次化的方法组织起来,使得子概念所包含的意义比它的父亲更加特殊,可以被其父概念所概括。层次化的概念模型与普通的平面概念模型不同,在这样一个模型中,概念之间的距离是不均匀的。通过这种距离,我们可以衡量出各个概念之间的相似程度。这样一个模型可以构造出一种更接近于现实的标准,使得基于这个模型的分类、聚类、匹配等工作变得更加合理。概念层次的建立实现了一个层次化的标准。通过将其它的元素(如单词、查询请求、文档)映射到概念上,就可以在这些元素之间建立起联系,并且这些联系是包含语义信息的。层次化地组织概念是网络挖掘中的一个很常见的问题,许多的应用场景都是基于这样一个思想来完成。本课题的工作大致分为三个部分。我们首先从底层着手,致力从网络信息终挖掘出一个概念描述准确、层次结构划分合理的概念层次模型。我们以目前正在流行的社会化标注为基础,设计了一套从社会化标注数据中抽取概念并建立层次关系的方法。我们还以概念层次为基础,发掘其在网络挖掘中的应用。针对搜索引擎广告服务中涉及的关键词推荐问题,我们提出如何利用概念层次来提高推荐的覆盖面和准确度的方法。最后,考虑到概念层次本身的规模庞大,我们也希望应用一些可视化的技术,能将概念层次的全貌直观展现给用户。我们的方法体现在展现概念层次内在联系与本身结构上,都取得了不错的效果。
其他文献
随着互联网的发展,文本过滤技术成为互联网内容处理的关键技术,对海量信息处理具有很重要的意义。传统的文本过滤方法,如基于统计的向量空间模型方法和概率模型方法,速度快,可实现
随着网络教育的蓬勃发展,与之相适应的资源建设也日益受到人们的重视。众所周知,网络教育有三大基础:硬件、软件和网络教育资源。Internet技术正在向宽带、高速、多媒体化方
地理信息系统(GIS)是用于获取、储存、查询、分析和显示空间地理数据的计算机信息系统。WebGIS(网络地理信息系统)是在Internet或Intranet网络环境下采用WWW协议的一种地理信
随着企业信息量的急剧增加,企业在管理其资源时希望提高各个环节的响应速度、改善企业的管理模式,以提高生产效率。而工作流技术的产生很好的满足了这一需求,它能够将企业的
P2P网络是近年来的研究热点,它具有自组织性好、容错能力强、可扩展性好等优点,是未来Internet的关键技术之一。随着P2P网络应用的日益盛行,分布式搜索技术已经成为P2P技术研
十一五期间,国家电网公司提出了建设SG186信息化工程,来整合公司的八大业务模块,通过统一的数据中心,形成总部、网省、地市三级应用。审计管理系统是国家电网公司SG186信息化
随着网络及网络性能飞速发展,在较大规模的开放网络环境下实现实时的可视化操纵(Visual Steering)系统成为可能。这样的分布式系统在很多领域有着广泛的应用前景,诸如军事模
服务器作为网络游戏的核心支撑系统,其设计和制作成为游戏开发的关键组成部分。本文提出了一个可行的解决方案,目的是提供一个稳定可靠的游戏服务器平台,降低后续网络游戏的
本文针对于现在的分布式系统或网络中的错误检测和诊断问题,提出了将依赖关系矩阵演化为依赖关系树,并且充分利用依赖关系树的特性,研究出基于此依赖关系树的适应性探测算法,
本项目的研究内容是面向大型机械设备——双进双出磨煤机的智能化嵌入式状态监测系统。双进双出磨煤机主要用于火力发电厂,为直吹式锅炉磨制煤粉。由于双侧输入原煤、输出煤