机器学习算法在基因功能预测和橡胶混炼控制中的应用

来源 :天津大学 | 被引量 : 0次 | 上传用户:leonontop
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习算法在生物识别,化工控制等领域都有着广泛应用。本文提出了新的基于偏最小二乘的改进算法,可以较好的解决生物识别和化工控制领域的3个具体问题:原核生物短编码序列识别,人类snoRNA识别,以及橡胶硬度在线测量。在原核生物短编码序列识别问题上,大多数方法在探测短基因序列上还没有达到理想的效果。因为短编码序列长度较短,其所含的生物信息有限,所以普通的方法难以准确的区分编码和非编码序列。本文提出了一种新的迭代适应性稀疏偏最小二乘算法作为分类器,来研究原核短基因的识别,以提高其识别精度。与传统的基因识别方法,如GeneMarkS, Metagene, Orphelia和Heuristic Approachs等方法相比,本文提出的方法取得更高的识别精度。实验结果也证实本文的算法相对于传统的分类器,如Logistic, RF(随机森林)和KNN(最近邻法),在预测精度方面也有着明显的提高,至少提高了5.90%。SnoRNA(small nucleolar RNA)在真核生物中普遍存在,在本文中,我们提出了一种快速友好的方法来加快人类snoRNAs的识别。在算法上,我们集合弹性网络和稀疏偏最小二乘算法的优势,提出了ESDA算法。通过与其他算法的对比,可以确认ESDA的有效性。相比于SnoReport,本文提出的方法不仅精度提高,而且简洁性和计算速度上均有优势。此外,我们将ESDA和其他一些著名的分类器如RF(随机森林),DWD(距离加权分类),SVM(支持向量机)进行对比,预测准确度最高可以提高25.1%。橡胶生产过程监控由于时变性的影响而变得复杂。本文提出一种橡胶硬度的在线测量方法,采用了核偏最小二乘模型,根据Q统计量不断更新模型,从而得到精确的橡胶硬度值,保证了橡胶的质量。本方法采用的监控报警装置可以减少安全隐患。
其他文献
为减少核电站的废物体积,用电加热桶内干燥技术对产生的浓缩液进行了初步研究。结果表明,干燥产物减容比约为4,平均含水率低于15%。说明电加热器桶内干燥核电站产生的浓缩液
中国文化发展的历史实际上是一部"偶像"崇拜的历史。孔子作为"偶像"崇拜最顶级的人格化身,对其思想的认知异化致使中国文化发展史在不同时期产生了不同的"偶像"崇拜个体,形成
王昭君是一个历史人物,同时也是一个艺术典型。作为"历史昭君",其和亲壮举被传为佳话;作为文学典型,其形象丰富而复杂:历代文人站在历史与现实的交汇点上,驰骋想象,大胆构思,
目的:探讨连续股神经阻滞(CFNB)联合硬膜外吗啡镇痛在老年患者全膝关节置换术(TKA)中的应用效果。方法:抽选2010年3月-2015年4月本院收治的86例行单侧TKA术的患者,随机分为对照组(n=4
我国可溶性钾盐资源缺乏且磷矿绝大部分属于中低品味,致使农业施用化肥多氮少磷缺钾现象严重。而以钾长石(K2O·Al2O3·6SiO2)为代表的难溶性钾资源却分布广泛、储量极其丰富
介绍了嵌入式系统的发展阶段及其实践教学特点。就计算机专业嵌入式系统方向,探讨了实践教学环节的定位和特点,阐述了在建立实践教学体系和改革实践教学方法的探索与实践。
【正】 50多年来营养干预是末期肾病治疗的基础。营养治疗的主要目的是用极低蛋白饮食改善尿毒症的症状。低蛋白饮食六十年代中期意大利广泛报道了使用低蛋白饮食治疗晚期肾
以质量为1:1的过硫酸铵和亚硫酸氢钠为引发剂,引发戊二醛交联后的壳聚糖微球(CCR)和甲基丙烯酸甲酯(MMA)反应,以制备甲基丙烯酸甲酯接枝的交联壳聚糖微球,制备的最佳工艺条件为:
本文报道了应用 B 超声波扫描技术对132名健康成人(男性78名、女性54名)胸壁厚度的观测结果。统计学处理结果表明,胸壁厚度变化范围为1.1—3.7cm。胸壁厚度与体重身高比及年
Web2.0时代的到来,催生了如Twitter、新浪微博、微信等多种新型社交媒体。借助于互联网平台的开放性、交互性、超时空性和动态实时性等特点,其消除了人们在社交过程中可能遇