嵌入欠采样技术的支持向量机集成分类算法的MicroRNA靶标预测

来源 :生物医学工程学杂志 | 被引量 : 0次 | 上传用户:yanrj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对MicroRNA(miRNA)靶基因样本数据不平衡导致阳性样本预测准确率低和整体分类效果不佳的问题,提出一种基于欠采样技术的集成学习算法——支持向量机(SVM)-嵌入下采样和权重平滑(IUSW)集成学习算法。算法采用SVM作为基学习算法,以AdaBoost为集成框架,迭代过程中嵌入基于聚类的欠采样以降低阴阳样本数据分布不平衡程度,同时在自适应样本权重调整过程中,以样本权重平滑机制剔除阴性样本中的异常点以避免过学习,最终以带权重的投票机制组合多个弱分类器预测结果作为miRNA集成分类器的预测结果。实验表明,在不平衡数据集上SVM-IUSW算法和其他算法相比,不但有效提高了阳性靶标的预测准确率和整体分类效果,还增强了miRNA靶标分类器的泛化能力。 In order to solve the problem that the accuracy of positive sample prediction is low and the overall classification effect is poor due to the imbalance of sample data of microRNA target genes, an integrated learning algorithm based on undersampling technology, Support Vector Machine (SVM) And weighted smoothing (IUSW) integrated learning algorithm. The algorithm uses SVM as the basic learning algorithm and AdaBoost as the integration framework. In the iterative process, the clustering-based undersampling is embedded to reduce the uneven distribution of data in the yin and yang samples. In the process of adaptive sample weight adjustment, the sample weight smoothing mechanism is removed Negative samples in order to avoid over-learning. Finally, a combination of multiple weak classifier prediction results with the weighted voting mechanism is used as a prediction result of the miRNA integrated classifier. Experiments show that compared with other algorithms, SVM-IUSW algorithm not only effectively improves the prediction accuracy and overall classification of positive targets, but also enhances the generalization ability of miRNA target classifier.
其他文献
本文收集了世界各语种文献中与阿育王传说、故事等相关的大量文本资料.并从汉文《阿育王传》出发,较为全面地考察了《阿育王经》、《阿育王息坏目因缘经》等汉译佛经中与阿育
对于竞争激烈的彩电行业来说,每个财年的年初都是行业大佬发表年度预测的时刻,并且有些预测后来被证明是完全正确,2009年也同样如此。
类型化广播在西方国家已经相对成熟和完善,但在国内却起步较晚,距今仅有十余年的时间。目前,部分中小城市电台在类型化广播方面已经进行了有益的尝试,但在发展过程中也遇到了
中法文化交流史渊源流长,尤其在十七、十八世纪,在法国形成了一股“中国热一的浪潮,中国文化对当时法国的很多思想家、政治家产生了巨大的影响。因此,中国著名经典已经开始部分地
摘要 图式语言是基于对美术语言表现的领悟而出发的,作为绘画艺术的图式语言要素之一,这是画家们不可或缺的艺术修养。画家们喜欢把自己所创作的对象称为灵感缪斯,在绘画实践过程中,画家们需要结合各方面的构想,包括物质视觉效应,表达情感等因素,会直接影响到创作者作品表现的因素,他们需要非常清晰地把握住自己内心世界的想法,才能把创作灵感转化为图像,表达出自己的内心世界与创作意图。本文将通过对乔治·莫兰迪的画作
〔目的〕为了预防和控制口岸医学媒介生物传播的传染病的发生,对港区及周边400m防控范围内医学媒介生物进行有效控制,确保盐田口岸的卫生安全。〔方法〕成立专业消杀灭队伍,
目前国内BIM的应用尚属初级阶段,除施工阶段BIM应用点基本可以形成体系外,设计阶段还主要体现在某些点的应用,还未能形成面,与项目管理、企业管理还有一定距离,运维阶段的BIM
期刊
中国乐凯胶片集团感光化工研究院(以下简称感光院)组建于1968年,前身是原化学工业部沈阳化工研究院感光专业.1987年,根据我国感光行业发展状况和沈阳化工研究院感光专业飞速
H.D.是一位多产的作家,其全名为希尔达·杜丽特尔。在将近五十年的写作生涯中,她创作颇丰,且创作题材广泛,从诗歌、散文到小说、译文,甚至电影剧本也有所涉及。尽管如此,她却
捷克裔法国作家米兰·昆德拉一直以其干练的文风和犀利的哲思为人们熟知。他的作品不仅在构思上千变万化,在哲理反思上也独树一帜。他的“思索的小说”(Roman de Réflexion)