基于CoP建模的信息过滤技术研究

来源 :中国科学院软件研究所 | 被引量 : 3次 | 上传用户:xrq_sjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前越来越多的企业采用信息管理或知识管理系统来提高工作效率,在这样的系统中,企业员工实际在虚拟的协作环境下工作,他们需要得到与自己工作任务相关的及时有效的信息支持。传统的信息过滤技术仅根据用户的兴趣来作信息过滤和推荐,难以满足用户要求。为此,本文提出一种基于CoP(Communites of Practice)建模的信息过滤方法,并对其中关键技术进行了研究。具体研究工作包括: 针对企业协作环境下用户的信息需求,提出了基于CoP建模的信息过滤方法。在企业协作环境下,企业员工经常会面临全新的工作和任务,由于对工作的不了解,他们不能产生相关的信息需求,从而传统的信息过滤方法不能为他们的工作提供及时有效的信息推荐。CoP指为了彼此共享知识以及在工作中相互学习而建立的小组,它的兴趣是其成员任务的反映。基于已有的信息过滤研究与证据理论,本文对CoP的兴趣进行建模,得到CoP的兴趣特征,并以此为基础研究和实现了面向CoP的信息过滤技术。 提出了一种基于领域的向量空间模型。在同一个信息过滤系统中,信息、用户兴趣和CoP兴趣的表示模型应该是一致的。目前广为使用的向量空间模型直观、简明、实现方便,但只能表达用户感兴趣的关键词,而不能很好地区别用户兴趣之间的差异,并且关键词数量过多导致了算法效率降低。针对此问题,本文提出一种基于领域的向量空间模型,建立了一个领域分类模型,并给出了计算信息在各领域中权值的方法。该模型能大幅度降低维度,很好地体现用户兴趣的多样性,并且可继续采用相似性度量公式等在向量空间模型中的成熟技术。 对已有算法进行改进,提出了一种加权的星型聚类算法以学习用户的兴趣特征。CoP的兴趣特征是由其成员用户的兴趣特征融合而来,因此用户兴趣特征的获取是CoP建模的基础。用户兴趣特征的学习算法是目前信息过滤研究的热点,聚类算法综合了目前流行的两类算法Rochio和kNN的优点,但传统的聚类算法不能体现用户对文档的不同兴趣度。本文提出的加权的星型聚类算法倾向于围绕用户兴趣度高的文档来构造文档簇,从而更好地反映用户的信息需求。 本文的研究成果可为企业协作场景下的信息过滤工作提供很好的理论和应用参考。
其他文献
爆闪式信号灯由于体积小,能在短时间内发出强光,具有很明显的警示作用,广泛用于机场导航、航空指示、道路交通、特种车辆(警车、救护车、消防车、工程车)等场合,有效地警告各种隐患,避免各种事故的发生,很好的起到了防患于未燃的作用。因此国内外生产厂家不断地开发出新产品,一是改变产品的外观造型,二是改善内部电路,使产品具有高可靠性、高稳定性、高性能价格比。本文详细讨论了在现有信号灯的基础上,设计出一种寿命长
随着计算机网络飞速发展, 网管问题越来越引起人们的重视, 其中服务质量的保证以及业务管理成为这一领域的关注焦点,用基于策略的思想来管理QoS网络成为近几年迅猛发展的网管
随着网络的迅猛发展和各种计算设备性能的飞速提高,在人们生活中使用的信息呈爆炸性的增长.大量的用户需要随时随地存储和访问自己的重要资料和数据,并且能够与他人方便地进
组合优化问题一直是科学研究领域中的一个重要问题。目前解决组合优化问题的方法可以分为两类。Non-Populationbased方法和Populationbased方法。本文主要讨论属于Population
当需要对来自地面同一区域的两幅或多幅遥感图像进行逐像素比较时,图像配准处理是必不可少的,遥感图像配准技术已成为海量遥感图像数据处理和充分利用的瓶颈问题,它作为遥感图像处理的重要理论和方法之一日益引起人们的重视。 本文在综合比较现有图像配准技术的基础上,提出了一种利用小波变换提取图像边缘特征点的基于灰度和基于特征相结合的遥感图像自动配准方法。该方法简单有效,可以达到子像素级配准精度。 本
Peer-to-Peer计算具有自适应性、自组织性、负载均衡、容错性、可用性等优点,被认为是在全球范围实现资源共享和提供协作环境的有效途径。然而,P2P计算的非集中式访问模式使传
现代计算机系统日趋复杂,处理器、存储系统、输入输出系统、操作系统、编译器以及应用程序对计算机系统的整体性能都有重要影响,所以需要我们采用能够真实反映客观实际的方法
本文旨在建立一个复杂的系统—沉积相建模系统的00模型。随着软件规模的日益增长,系统的复杂性急剧上升。面向对象技术提供了驾驭系统复杂性的能力和手段。面向对象技术的关键
随着移动接入设备的普及,语音作为一种快速方便的交互方式,越来越受到重视。说话人识别技术,作为语音应用技术的一部分,也有着广阔的应用前景。  在说话人识别中,注册阶段和测试
本文研究了刺绣图像自动编针中的若干关键技术。在对图像处理和识别、图形学及人工智能等相关技术研究的基础上,根据刺绣图像实际情况提出了一些改进算法和新的算法。本文主要