复杂关联数据的张量模型与应用研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:linxi054
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多研究领域,数据呈现出多模态的结构特性,张量可以清晰完整地表示这类数据。而张量数据的向量化处理丢失了大量的数据结构信息,甚至造成维数灾和过拟合现象。张量分析的方法直接输入张量数据,能够有效保持数据的结构信息;此外,以张量数据为基础的模型和算法,在减少参变量数目的同时,缓解向量方法在模型学习时极易出现的过拟合现象,这意味着张量模型处理高维小样本问题更加有效,为分析高维向量数据提供了一种新的思路。基于张量的数据分析方法具有更加广泛的应用前景,所以本文探讨两类复杂关联数据的张量模型及其应用,一类具有天然的张量结构,一类可以转化为张量进行处理。本文的研究内容主要包括以下几个方面:1.对象关联数据的张量模型及其应用研究。传统方法破坏了张量数据的结构特性,张量可以有效表示该类复杂关联数据。以社会标注系统为背景,用张量及张量分解模型研究该系统的高阶结构特性和统计特性。以系统中的用户、资源、标签三大对象作为三个维度,引入权重值区分“用户-标签-资源”三元关系的关联强度,建立三阶权值张量模型,张量分解后得到最优核张量和三个维度的特征矩阵,以及新的三元关系的评分值,根据最优的评分值产生推荐列表,向用户推荐资源或标签。2.属性关联数据(向量数据)的张量模型及其应用研究。在实际问题中,存在很多具有关联关系的属性数据,通常采用向量方法进行处理,向量维数过高时容易产生过拟合现象,张量分析方法在减少模型参变量的同时缓解或避免了过拟合现象。本文基于向量数据的学习方法,主要是支持向量机的分类、回归和特征选择方法,自然地推广到张量空间,得到支持张量机的分类模型、回归模型和特征选择方法,实验对比证明,支持张量机模型不仅可以分析向量数据,还可以有效缓解高维小样本问题。3.实证研究:基于张量空间模型的网络舆情分析。通过张量方法向用户个性化推荐网络舆情热点话题,并实现网络舆情文本的有效识别和自动分类。在实现个性化推荐时,用张量对用户和网络舆情建模,通过张量分解分析用户的兴趣倾向,进而向用户个性化推荐网络舆情热点话题,实验结果表明,引入权重值的张量分解模型将进一步提高推荐资源的准确率,使个性化推荐结果更加精确。在实现网络舆情文本的有效识别时,将文本表示为20×20的二阶张量,构造张量分类器对网络舆情文本进行分类,实验结果表明,支持张量机模型在解决网络舆情文本的高维小样本问题和数据偏斜问题时具有更好的泛化性能。可见,将张量空间模型应用于网络舆情分析领域具有广泛的应用价值。
其他文献
传统铁道车辆的被动悬挂系统是依据标准的车轮和钢轨型面综合各项指标折衷优化设计的,在运营过程中其阻尼特性是无法实时改变的,不能适应外界条件的变化。当列车的运行条件、线路条件、轮轨磨耗等出现变化,而被动悬挂系统参数无法适应时,列车的动力学性能会出现恶化的现象。此外,随着运营里程的不断增加,被动悬挂系统本身也会出现性能退化,造成列车的动力学性能恶化。因此,为改善高速列车的运行品质,设计一种可以适应外界条
RXRα是核受体超家族中重要的一员,属于非类固醇类受体。RXRα是受配体调控的转录因子,参与了人体包括代谢、生长、发育、分化、死亡和免疫等在内的几乎所有的生理活动,其表
“跨界基因沉默”技术是一种全新概念的小分子干扰RNA传递技术,其主要方法是利用基因被人为改造的、能侵入哺乳动物细胞的细菌合成小分子干扰RNA,这种携带有可沉默特定基因的
背景随着社会的进步,人类在日常生活中接触电离辐射的机会越来越多,因此受到的辐射损伤也越来越多。男性的生殖系统对电离辐射高度敏感,射线会使精子浓度、活率、活力、形态
碱金属铌酸盐种类较多,如具有优良压电铁电性能的钙钛矿结构碱金属铌酸盐(K,Na)Nb O3(KNN)材料,具有优异光催化性能的四方钨青铜结构碱金属铌酸盐Na,K6Nb10.6O30,等。在同体系中,纳米结构的材料往往具有独特的性能和潜在应用,因而具有重要的研究意义。目前采用固相法制备超长微纳米线未见报道。本文对Na,K6Nb10.6O30微纳米线的无模板固相法制备、结构等进行研究,并探索采用相同方
目的:探究五味子甲素(Deoxyschizandrin)联合吉西他滨(Gemcitabin,GEM)对肝癌细胞HepG2增殖的影响及其可能的作用机制。方法:1.五味子甲素与吉西他滨单独及联合应用对肝癌细胞HepG2增殖及凋亡的影响:肝癌细胞HepG2分别经不同浓度的五味子甲素、吉西他滨单独及联合用药作用48h后,采用CCK-8法和平板克隆法检测细胞增殖活力;采用细胞流式术检测细胞凋亡比例的改变。2
[研究背景]癌痛是肿瘤患者最大的负担之一,癌痛控制不足的现象在我国仍较为普遍,癌痛给病人带来的心身影响极其严重,超过50%的患者遭受过癌痛的折磨。癌痛不仅给患者带来巨大的痛苦,还给家属带来一种负担。如果癌痛得不到控制,一方面会加速肿瘤的发展,另一方面会影响患者的睡眠、食欲、免疫力,加重患者的焦虑、抑郁等不良情绪。如果慢性疼痛不能解决将会发展成顽固性癌痛,导致患者自杀的重要原因之一。针对癌痛世界卫生
聚阴离子型Li2FeSiO4材料具有理论比容量高、循环稳定性良好等优点,是一种有前途的锂离子电池正极材料。然而,较低的电子传导率和较差的锂离子迁移速率限制硅酸亚铁锂的发展
非平凡简单连通无向图G =(V,E)的原子键连通性(ABC)指数定义为(?),其中V={V0,V1,…,Vn-1},d(vi)为G中vi的度.由于该拓扑指数在化学中有着广泛的应用,受到了众多学者的关注.然而其中两
记录匹配的主要工作是合并两个及多个不同来源的文件,当文件中缺乏唯一的标识符时,此问题的研究则被视为一个富有挑战性的问题。本文我们主要根据中文姓名的特征,年龄及职业