数据挖掘技术在生物信息学基因变异规律研究中的应用

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:kaiyuanwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的 聚类分析中适宜类别数的确定和结果的验证一直是难以解决的问题 ,而在生物信息学研究中这一矛盾尤为突出 ,本文试图将数据挖掘技术引入这一领域 ,以期能有所帮助。方法 以甲型流感病毒的H3序列为例 ,按照数据挖掘的思想将其拆分为训练集和验证集 ,然后使用两阶段聚类法和自组织图进行聚类分析 ,利用验证集对聚类结果进行验证 ,并进行各类的特征描述。结果 两阶段聚类法可自动搜索适宜的类别数 ,两种聚类方法结果相互验证 ,以及验证集的结果验证都证实了聚类结果的准确性。结论 数据挖掘方法体系中的智能聚类技术可以满足基因序列数据聚类问题的需求 ,其相关技术可较好的解决类别数判定、结果验证等问题 ,值得在该领域中推广
其他文献
英语写作在二语教学或者外语教学中地位举足轻重,这是许多语言教师和研究者公认的。反馈是写作教学的关键环节。如何在写作过程中为学生提供有效的反馈信息,一直以来都是国内
湖南三立应用优质花垣矿作原料,采用简易黄铵铁矾法生产电锌,由于在实践中注意控制焙烧脱硫条件,并用回转窑ZnO作除铁中和剂,加上工艺不断优化,故取得了较好效益.
分布式电源并入配电系统所带来的许多新问题已经成为近年来电力工业界和学术界关注的热点。以光伏发电为例,由于光伏电源的出力受天气影响较大,可能造成配电系统中电压的波动
在诸多介入和参与当代文学史建构的选刊当中,《新华文摘》是一个独特的存在。她虽然是一份综合类选刊,但从创刊伊始,《新华文摘》便重视对文学作品与评论文章的选载,及时地呈现时
<正>截至2017年底,银行胜诉案件中能够成功办理退费的案件只占到28%,尚有68%的诉讼费申退工作尚未落到实处。实践中,大多数银行并未将诉讼费申退作为诉讼案件管理的一项重要
泛素-蛋白酶体系统(ubiquitin-proteasome-system,UPS)是控制蛋白质降解的主要系统,也是细胞基本活动的关键调节器。去泛素化酶(deubiquitinating enzymes,DUBs)是泛素-蛋白
史诗主要内容多为民间流传的古老传说抑或是传颂英雄丰功伟绩的长篇叙事诗,流传至今的彝族史诗是彝族历史沿革及其民族精神和社会生活发展的神话式表达,创世史诗《梅葛》是彝
小分子捕获(Small Molecular Trapping,SMT)技术是利用基因工程手段改造捕获酶,降低其对底物或待测小分子的催化、分解活性,但保留或增强其对底物或待测小分予物质的亲合力,
目的评价成人接种乙肝基因疫苗后的免疫效果。方法文献检索符合本研究分析条件的成人乙肝基因疫苗接种免疫效果论文10篇,5篇为实验对照研究,5篇为平行对照研究,用抗HBs的转阳
产业集群表现出的强劲、持续竞争优势使其成为决定区域竞争优势的主要因素和推动世界经济发展的中坚力量。在我国产业集群有了一定的发展,尤其在江浙、福建、广东沿海一带,已经