多条件多样本RNA-Seq数据的剪切异构体表达水平估计

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:qianwenlong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当处理多条件多样本RNA-Seq测序数据时,现有方法忽略了读段分布样本之间存在高度相似性的特点.本文提出了一个基于多条件多样本RNA-Seq测序数据剪切异构体表达水平估计方法MCMS-Seq.该方法建立了一个联合偏差估计模型来提取读段分布在样本之间的相似性特征,同时考虑读段分布受全局偏差和局部偏差的影响.此外,增加 L2/L1组稀疏约束和L1稀疏约束两个正则化项,用来体现基因和剪切异构体之间存在稀疏特性,以及消除技术性误差和数据噪声的影响.通过多个真实数据集的验证,MCMS-Seq方法能获得更为准确的剪切异构体表达水平,同时也能提供更有意义的生物性解释.
其他文献
为了去除高光谱图像多视图主动学习分类中的所选样本的冗余,降低人工标记成本,本文提出了两种用于多视图主动学习分类中的多样性样本选择方法。将高光谱图像进行超像素分割,将所选样本中属于不同的超像素的样本加入训练集,其余样本加入候选集;比较各视图对样本的预测标签,将所选样本中预测标签不完全相同的样本加入训练集,其余样本加入候选集。本文分别用这两种方法对传统多视图主动学习的样本选择方法进行改进,并用两组高光
大数据时代的到来,使得信息量暴增的同时,数据维度也呈现几何式增长.在保护用户隐私的前提下,如何充分挖掘高维数据的可用信息,成为了大数据发布领域的研究热点和难点.差分隐私作为一种强大的隐私保护模型,被越来越多地应用到高维数据发布中.本文归纳了差分隐私及其相关方法在高维数据发布的应用,重点分析了差分隐私和特征降维、特征抽取、贝叶斯网络、树模型以及最新提出的粗糙集和随机投影等方法在高维数据发布中结合应用的优缺点,梳理了各个方法在高维数据方面的应用和对比,最后对未来差分隐私在高维数据发布中的应用方向进行了展望.
采用对抗训练的方式成为域适应算法的主流,通过域分类器将源域和目标域的特征分布对齐,减小不同域之间的特征分布差异。但是,现有的域适应方法仅将不同域数据之间的距离缩小,而没有考虑目标域数据分布与决策边界之间的关系,这会降低目标域内不同类别的特征的域内可区分性。针对现有方法的缺点,提出一种基于分类差异与信息熵对抗的无监督域适应算法(adversarial training on classificati
舰载机位姿实时检测对于甲板上的舰载机的运动控制、轨迹规划与防撞等具有重要意义。传统的舰载机调度主要依靠人工判断舰载机位置与航向角进行调度,传统方法不能得出准确数据,还易因为操作员的疏忽与疲劳发生碰撞事故。针对该问题,提出了舰载机位姿实时视觉测量算法。基于YOLO-V4(you only look once version 4)网络以及Canny边缘提取算法对舰载机进行识别分割。创新性地提出一种线框
为了解决现阶段缺乏被口罩遮挡的人脸数据集的问题,本文提出了基于生成对抗网络与空间变换网络相结合生成戴口罩的人脸图像的方法。本文的方法以生成对抗网络为基础,结合了多尺度卷积核对图像进行不同尺度的特征提取,并引入了沃瑟斯坦散度作为度量真实样本和合成样本之间的距离,并以此来优化生成器的性能。实验表明,所提方法能够在没有对原始图像进行任何标注的情况下有效地对人脸图像进行口罩佩戴,且合成的图像具有较高的真实
静息态功能磁共振图像是随着时间变化的一系列三维图像。已有的3D卷积过程本质上是对三维图像数据或二维图像+时间维数据进行处理,无法有效地融合静息态功能磁共振图像的时间轴信息。为此,本文提出了新型的4D卷积神经网络识别模型。具体而言,通过对输入的fMRI使用四维卷积核执行四维卷积,在自闭症患者的功能磁共振图像中,从空间和时间上提取特征,从而捕获图像在时间序列上的变化信息。所开发的模型从输入图像中生成多
分类器模型之间的多样性是分类器集成的一个重要性能指标.目前大多数多样性度量方法都是基于基分类器模型的0/1输出结果(即Oracle输出)进行计算,针对卷积神经网络的概率向量输出结果,仍需要将其转化为Oracle输出方式进行度量,这种方式未能充分利用卷积神经网络输出的概率向量所包含的丰富信息.针对此问题,利用多分类卷积神经网络模型的输出特性,提出了一种基于卷积神经网络的概率向量输出方式的集成多样性度量方法,建立多个不同结构的卷积神经网络基模型并在CIFAR-10和CIFAR-100数据集上进行实验.实验结果
针对动用计划下的车辆装备备件的消耗特点,研究了车辆装备维修备件消耗量和库存控制两个预测优化问题.考虑动用计划期内车辆装备的预防性维修和修复性维修,实现定时定程维修和自然随机故障维修下装备维修备件的消耗量的预测.在此基础上,根据备件库存检查方式的特点,建立基于定期检查策略的联合补货库存控制模型,根据模型的结构特点确定决策变量界限,并利用多类种群位置更新方式改进了果蝇优化算法.仿真结果表明,改进的果蝇优化算法具有良好的求解效率,本文所提出的优化方法可为车辆维修保障资源优化提供决策依据.
针对产业化的汽车仪表指针人工视觉检测效果差、检测速度慢和实时性低等问题,本文提出了一种改进的Faster R-CNN汽车仪表指针实时检测算法。通过改进原始的RoI网络层结构,实现小目标高低层特征之间的完整传递;采用双线性内插算法替代两次量化操作,使得特征聚集变成连续的过程,能够有效减少计算时间;最后将工业机采集的视频数据,预处理成VOC格式数据集进行训练,调整超参数得到改进汽车仪表指针检测模型。实
针对SLAM (simultaneous localization and mapping)在急转弯、快速运动场景中定位失败的问题,提出一种融入注意力和预测的特征选择即时定位与地图创建(SLAM)算法,选择随着相机的运动更有可能保持在视野中的特征点,舍去即将消失在视野中的特征点。首先利用logdet度量量化特征选择的可行性,然后计算特征点的信息矩阵,再从检测到的特征中通过贪婪算法选择k个特征(近似