【摘 要】
:
蛋白质复合物是细胞结构和生化机制的研究基础,如何准确识别蛋白质复合物成为近年来的研究热点。针对传统算法根据结构信息对蛋白质复合物进行搜索存在敏感度和F-measure低的问题,以及现有监督学习算法根据人为构造特征进行蛋白质复合物识别存在特征构造不能较好地反映图的真实信息等不足,提出了graph2vec-SVM识别算法。将蛋白质复合物看作稠密子图并考虑子图模块度大小,利用graph2vec将图信息转换为向量,并进一步采用SVM分类器对蛋白质复合物进行识别,提高了蛋白质复合物识别的敏感度和F-measure。
【机 构】
:
桂林电子科技大学广西可信软件重点实验室
【基金项目】
:
国家自然科学基金(61762027,U1501252),广西自然科学基金(2017GXNSFAA198172)。
论文部分内容阅读
蛋白质复合物是细胞结构和生化机制的研究基础,如何准确识别蛋白质复合物成为近年来的研究热点。针对传统算法根据结构信息对蛋白质复合物进行搜索存在敏感度和F-measure低的问题,以及现有监督学习算法根据人为构造特征进行蛋白质复合物识别存在特征构造不能较好地反映图的真实信息等不足,提出了graph2vec-SVM识别算法。将蛋白质复合物看作稠密子图并考虑子图模块度大小,利用graph2vec将图信息转换为向量,并进一步采用SVM分类器对蛋白质复合物进行识别,提高了蛋白质复合物识别的敏感度和F-measure。
其他文献
光滑粒子流体动力学(SPH)是近年来兴起的一种无网格的粒子方法,SPH在处理大变形、运动物质表面以及自由表面等问题时优势明显,在数值模拟领域得到了非常广泛的应用,是一种典型的科学计算应用。作为一种显式的粒子方法,SPH在每一个迭代步都需要计算大量的粒子间相互作用,计算量非常大,如何提高SPH的计算效率成为研究热点。可伸缩矢量扩展(SVE)是ARM针对高性能计算推出的下一代SIMD指令集,基于SVE研究了SPH方法的SIMD加速方法,取得了显著的加速效果。
针对深度神经网络为了追求准确度对计算资源造成的巨大消耗,与边缘计算平台所处的受限环境之间的矛盾,探究利用FPGA逻辑资源搭建神经网络张量处理器(TPU),通过配合ARM CPU实现全新的边缘计算架构,不仅实现对深度神经网络模型的加速计算以及准确度的提升,还对功耗进行明显优化。该架构下,压缩后的MobileNet-V1网络准确度可达78.1%,而功耗仅为3.4 W,与其他不同计算架构的深度学习边缘计算平台的对比结果表明,该系统在不降低准确度的条件下,对于小规模深度神经网络的加速计算有着明显优势。
随着高速信道的传输速率变快,传输长度变长,结构复杂度变高,对信道进行建模也变得复杂与艰难.将目前比较火热的机器学习方法与高速信道结合起来,提出了一个新颖的方法.利用采
针对现有颗粒扩散模拟方法未考虑多个污染源问题,导致模拟效果不理想,提出基于GIS的大气污染颗粒物浓度扩散模拟分析。按照离散气象站点位置的风向和风速信息构建风场表面,利用烟囱出口位置风速均值等环境条件,计算大气颗粒物污染参数,建立高斯扩散模型;考虑多个污染源问题,转换高斯扩散坐标系与地理坐标系;创建基于GIS的大气颗粒物浓度扩散系统,使用相空间重构把颗粒物浓度序列映射至高维特征矢量空间,形成相点结构
将排序学习的方法应用于构件检索的研究中,首先,采用刻面描述的方法对构件进行全面的描述,并通过word2vec模型和权重设定的方法对刻面描述的构件进行特征提取;然后,对构件特征进行潜在语义分析和余弦相似度计算,得到构件训练数据集;最后,通过使用构件训练数据集和构件数据集对经过改进的Plackett-Luce概率排序模型用最大似然估计方法训练模型参数,从而得到一种构件排序模型。将构件排序模型应用到构件检索中开发实现了一个构件检索方法,通过实验验证了此方法的有效性,其查全率、查准率和效率都优于传统的构件检索方法
对于恶劣舆情准确识别并进行有效干预,对舆论走向的引导有着重大的意义。首先通过爬虫抓取网络数据,对数据进行特征提取,采用融合文本情感分析的改进KNN算法开创性的对网络舆情进行定量的严重性分级,严重等级越高的舆情,调控力度应越大;为进一步探讨调控手段的有效性和调控力度,基于精细划分的SIR模型模拟各舆情调控手段对舆情的整体影响,并及时反馈并做出修正,同时这种方法也为研究舆情调控手段提供了一定理论基础。
分布式大数据计算引擎是科研机构、互联网企业和政府部门处理大规模数据必不可少的工具,它们的使用和推广促进了各个领域的快速发展,为社会进步做出了巨大贡献。但是,在多作业处理的情况下,目前主流的大数据计算引擎在资源分配和作业调度方面仍有许多不足之处,它们通常对多作业平均划分内存资源并以先进先出FIFO的方式调度作业,这样简单的资源划分方式和作业调度机制并不能充分利用系统性能。针对此问题,从计算引擎的作业层面做出了改进:在资源划分方面,通过提取作业特征对作业的任务量进行预估,判断作业任务量和作业预分配资源间的差异
针对设计模式变体挖掘准确率较低的问题,提出引入线索约束的设计模式变体挖掘方法,旨在基于约束满足问题CSP描述设计模式变体线索,给出DPVMC算法,分结构特征约束与时序特征约
编译优化技术的目的是挖掘程序中的优化空间,提高程序编译或运行效率,无效代码删除优化是被广泛使用的编译优化技术之一,它旨在删除程序中不可达的代码,以提升程序的执行效率。许多应用程序的执行路径往往与运行时的输入参数值相关,并且在一些分支路径上与运行时参数值相结合,可能存在无效代码,通过现有的无效代码删除优化,很难做出优化处理。为此,提出一种依赖数据流分析的激进蝴蝶优化方法,利用SSA中间表示,根据动态运行时的参数可能值,自动为程序生成代码形状类似蝴蝶(butterfly)的分支代码,使编译器在程序编译阶段为相
随着计算机视觉领域中各项研究的发展,目标跟踪变得越来越热门,在各行各业得到广泛应用。基于无人机的目标跟踪也随之得到发展。相比于普通的目标跟踪,利用无人机进行目标跟踪有不少优势,但是也存在一些挑战。针对有关无人机目标跟踪的数据集有限,数据质量不高,且部分数据集中数据缺少统一标注的情况,基于无监督学习,设计了一种新的无人机目标跟踪模型。该模型对UDT模型的主干网络和跟踪方法进行了改进。结合了SiamF