社会标签系统和社会网络中的数据挖掘

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:guo20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标签系统以及社会网络作为Web2.0技术的典型应用,已经受到了来自产业界和研究界的广泛关注。人们普遍认为,标签作为一种用户自发的对网上内容进行分类和标注的信息,能够促进信息检索的效率,并吸引更多的用户更深入的使用互联网资源。然而这种自组织的数据却为研究者带来了挑战。研究者在从数据的分析,到标签语义结构的挖掘,到最终利用标签信息辅助推荐和检索,进行了一轮初步的研究后,发现对标签系统中数据的了解仍不完整,因而对标签的使用也只限于简单的方法。而在社会网络方面,虽然已有的社会学和物理学领域的基础研究已经相当丰富,但如何从虚拟社会网络所提供的人的活动信息提炼出人与人关联的动机和机制,以及社会网络如何帮助信息的传播,这些问题仍没有建立起与方法的直接对应。   本文针对以上问题,在已有研究的基础上,进行了三个方面的探索:   ①用复杂网络的统计分析方法研究了标签数据和社会网络数据。对复杂网络的统计方法,在标签数据特有的三项图中进行改进。根据统计分析结果,深入地阐述了标签数据所表现出的潜在规律性和应用价值。   ②从作为特征和作为用户浏览的中间量两个角度,完整的评估了标签在推荐系统中的作用。提出了基于三项图的用户浏览模型,利用基于随机游走的相似度计算,将用户利用标签来寻找潜在资源的不同行为模式融入推荐中,并取得了良好的效果。   ③用渗透模型验证了社会网络中存在的标签传播,及其传播的模式。定义了基于信息传导的重要性参数,并通过该参数寻找社会网络中的关键用户。首次将社会网络通过图模型引入推荐中。   总的说来,本文在已有的标签系统和社会网络研究的基础上,做出了进一步的有益探索。
其他文献
本文根据鲹科鱼类的运动学模型和实际元器件约束,开发了一种新型的带有可转动胸鳍结构的仿生多模态机器鱼;结合鱼类的游动特征,设计并实现了机器鱼的多种游动模态;最后,提出了基于
在经济全球化和合作共赢观念盛行的今天,从供应链(包括企业间供应链和企业内部供应链)的角度出发对各项企业功能进行优化,可以提高企业的市场竞争力,同时又能够降低企业所在供应
差分进化算法(DE)是一种简单高效的优化算法,但是收敛精度不高,容易陷入局部最优。 为了提高差分进化算法的寻优速度和寻优效能,本文提出了一种改进自适应差分进化算法。该算
近年来,无线通讯技术迅速发展,无线应用己遍布人类社会各个角落。无线ad hoc网络是无线通讯领域的研究热点之一。无线ad hoc网络具有组网灵活、快捷,且不受有线约束等优点,使之在
学位
由不同功能UUV组成的异构系统能够实现对水下多个目标的探测和识别,多台UUV的协作机制已经成为当前水下机器人领域的一个热点课题。论文的研究工作依托国家863计划“基于弱通
学位
随着通信技术、计算机技术和控制技术的飞速发展,网络控制系统已经成为自动化领域的研究热点。网络控制系统是通信和控制系统的综合应用,二者的结合带来了许多新的问题,如网
准确的测量数据是实现计算机过程控制、模拟和优化的基本依据。因此如果要获得高质量的测量数据就需要对数据进行处理。 本文在对数据校正原理及发展深入研究的基础上,在数
关联向量机(RVM)是在支持向量机基础上结合贝叶斯学习方法发展起来的一种新的机器学习算法,它不仅具有比支持向量机更好的非线性回归性能,同时还具备支持向量机所没有一些特点,
生产调度(Scheduling)广泛存在于生产和物流系统中,是典型的组合最优化问题。生产调度根据调度信息的完整性可分为离线调度和在线调度。离线调度是指在调度时刻工件的信息全部
复合材料由两种或两种以上不同物质以不同方式组合而成,它可发挥各种材料的优点,克服单一材料的缺陷,扩大材料的应用范围,在工业、航空航天、军工等领域具有广阔的应用前景。复合