【摘 要】
:
世界上不同生物种类特征各不相同,在基因组序列中四种碱基的无间隔排列形成天然随机密码序列。在计算机技术快速发展的时代,病毒基因组序列的传统分析研究方法已经无法满足变异性较大的RNA病毒基因大数据研究需求。在基因序列分析研究中广泛使用信息熵作可视化模型分析,对比经典方法仍存在一些局限性。本文提出集成熵的分析模型和处理方法,在平均熵和集成熵的度量下,形成整体不变量,突破参数空间限制,形成唯一可区分的位置
论文部分内容阅读
世界上不同生物种类特征各不相同,在基因组序列中四种碱基的无间隔排列形成天然随机密码序列。在计算机技术快速发展的时代,病毒基因组序列的传统分析研究方法已经无法满足变异性较大的RNA病毒基因大数据研究需求。在基因序列分析研究中广泛使用信息熵作可视化模型分析,对比经典方法仍存在一些局限性。本文提出集成熵的分析模型和处理方法,在平均熵和集成熵的度量下,形成整体不变量,突破参数空间限制,形成唯一可区分的位置分布图示,便于观察大量基因组序列群聚在特定的几何区域中。共选取上万种新型冠状病毒基因组序列和其他各类RNA病毒基因组序列,展示早期不同国家地区发布的基因组序列分布各不相同,新型冠状病毒基因组序列形成具有特点的两种分布形态,为后续探讨病毒溯源等论题提供测量基础支撑。利用移位算符支持经典K-MERS算法的集成操作涉及到选定群集的组合运算,从宏观统计角度,适配多种情况下的不同组合模式。从选择定向处理的角度,这种系列复杂分布具有特殊实验意义。利用经典BLAST将对齐后的新型冠状病毒基因组序列RdRp区域形成强烈的群聚效应,提供优化发育树根节点的分层结构化需求。中心平均值位点计算与各序列熵值的距离大小,从测度的层面,作为新型冠状病毒相关性标准,结合比对经典生物学已得到的相似度结论,验证本文方法有效性。基于这类通用的测度结构,为识别新型冠状病毒基因变异量化测度范围提供理论支撑,为探索病毒来源以及功能模块同源性分析提供新方法。
其他文献
氮(N)是生态系统生产力的限制性元素之一,土壤氮循环是生态系统氮循环的重要组成部分,包括生物固氮、矿化、硝化、反硝化和无机氮的同化等多个重要过程。其中生物固氮是自然生态系统中氮素来源的重要途径之一,而氮的矿化和硝化过程则是土壤有效氮供应与保持的两个关键过程,也是评价土壤氮素供应能力和氮素损失风险的常用指标,对生态系统生产力的维持及生态环境的保护具有重要意义。但目前对青藏高原土壤氮循环的空间分布特征
木霉属真菌(Trichoderma)是一种重要的丝状真菌,因其能拮抗多种植物病原真菌而备受关注,目前已被广泛研究并作为生物农药、生物肥料和土壤改良剂在市场上销售。木霉属真菌富含丰富的次生代谢产物,包括萜类和非核糖体肽等,具有显著的生物活性。目前木霉萜类代谢产物的研究大多集中在化合物的分离鉴定与活性测定,而关于木霉属特征萜类化合物的生物合成研究报道较少。本实验室前期研究发现,深绿木霉(Trichod
纳米材料因其独特的微观结构而赋予其特殊的不同于宏观材料的物理化学性质,在过去的几十年中吸引了广大科研工作者的研究兴趣。有机/无机纳米复合材料是高级功能材料科学中一个迅速发展的研究领域。这些材料是由纳米有机和无机对应物组成,并通过分子水平上的相互作用在界面上产生独特的性能。本论文拟立足于新兴二维纳米材料、大环超分子化合物、金属纳米粒子、金属卤化物等纳米材料通过共价/非共价作用力构筑了一系列有机/无机
内生菌群与宿主植物间有着密切的相互作用关系,在植物的生长发育和应对环境中发挥着重要作用,有望应用于农业生产中对作物进行品质调控。针对植物内生菌的起源、及其在植物生长发育过程中的组装、系统传递、空间分布等许多方面仍然存在较多盲点问题。本研究使用高通量测序方法分析并系统研究了两个酿酒葡萄品种玫瑰蜜(Vitis vinifera-V.labrusca)和赤霞珠(Vitis vinifera cv.Cab
<正>目的:对一株分离自健康人粪便多粘菌素耐药的肺炎克雷伯菌的耐药机制进行研究及遗传背景分析。方法:将健康体检者粪便标本接种于SS和绵羊血琼脂平板,经35℃培养18~20 h,挑取单菌落用基质辅助激光解吸电离飞行时间质谱(Matrix-Assisted Laser Desorption/Ionization Time of Flight Mass Spectrometry,MALDI-TOF MS
EE2是EDCs中活性最强的雌激素之一,其广泛存在于各类水生介质中,在环境中具有持久性和生物蓄积性,会对生物体甚至其后代产生恶劣的影响。光催化技术可在光照情况下将有机污染物矿化成CO2等无害小分子,是一种去除EE2的理想选择。半导体BiOX(X=Cl,Br)具有独特的层状结构和优良的光电性能,但是其对可见光较低的利用率限制了它作为高效光催化剂的应用,本文通过两种办法来扩宽BiOX(X=Cl,Br)
随着工业和农业快速发展,大量的重金属镉(Cd)被排放进入环境,导致了我国严重的土壤Cd污染问题,严重影响粮食安全并危害人类的健康。微生物修复是一种安全、经济、简单的土壤重金属修复技术,其中植物促生菌既可促进植物生长,也能阻控植物对重金属的吸收;生物炭既可作为微生物的载体,也具有良好的重金属污染土壤修复效果。因此,本研究以课题组前期优选出的功能菌Pseudomonas sp.,AN-B15为基础,通
微型传感智能设备的普及,使人们可以随时随地记录日常活动数据,人体活动识别逐渐成为研究热点,广泛应用于医疗康复、智能家居等方面。目前,常采用深度学习算法和传统机器学习方法来进行人体活动识别,深度学习算法虽能自动提取特征,但其在中小规模的活动数据集上,往往容易过拟合;传统机器学习方法虽然对样本需求量不大,但需要手动提取特征,特征很大程度上决定了识别效果。因此,本课题对中小规模活动数据集上的人体活动识别
随着现代CPU功率密度的不断提高,计算机芯片的温度管理已成为多核系统的重点研究问题之一。随着机器学习的兴起,出现了大量基于机器学习的计算机系统温度优化算法。虽然基于监督学习的任务调度算法在特定情况下取得很好的效果,但是这类方法很难获取全面的训练数据,此外自适应能力差且可移植性较弱。由于强化学习极强的动态决策能力在多个领域表现出强大的能力,而且强化学习很大程度上克服了监督学习在可移植性差、可扩展性较
心音是人体重要的生理信号,可以作为先天性心脏病诊断的关键依据。传统先心病诊断方法为医生下乡进行听诊筛查,受限于人力资源有限,该方法成本高昂、效率低下,难以遍及所有地区。本文借助数字信息处理技术,提出了一种适用于先天性心脏病心音信号的计算机辅助诊断算法,旨在为先天性心脏病筛查提供一种新的技术手段。心音为微弱低频信号,其频率低、振幅小,在采集过程中极易受到临床环境的影响。因此,在临床环境下,对心音进行