基于改进的K-Means算法在SNP选择中的应用

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:yishu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SNP数据作为重要的基因变异数据,是目前生物信息学领域中重要的课题之一,但由于SNP数据中存在较多的冗余和噪声,因此对SNP数据进行特征提取尤为重要。论文针对SNP数据少样本、高维度的问题和SNP位点之间具有强相关性的特点,在K-Means聚类中引入互信息,提出了一种改进的聚类算法K-MIM,将其应用于SNP选择中。K-MIM算法解决了传统的K-Means算法不能挖掘出SNP位点之间内在关系的问题,并在医院提供的临床数据实验结果表明,K-MIM/蚁群算法所筛选出的信息SNP子集,较K-Means/蚁群、M
其他文献
随着大数据、云计算、移动互联网等技术的迅速发展,人工智能的技术逐渐成熟,无人驾驶逐渐成为可能。而无人驾驶最重要的一个技术点就是图象识别,通过图像识别前方车辆、行人、障碍物、道路以及交通信号灯和交通标识。通过自动驾驶可以减轻驾驶员的负担,减少交通事故的发生频率。论文收集了多个城市的交通道路图像,通过分析交通目标特点,对其车辆、行人以及非机动车进行标注,将其作为样本进行训练。采用一种基于YOLO的深度
为了便捷实时地采集油菜图像并提取特征参数以便于诊断油菜病虫害级别,论文设计并实现了一个基于iTop-4412开发平台的油菜图像采集与虫害特征参数提取系统。该系统主要由一个便携图像采集终端和一个搭载了图像处理功能的嵌入式平台组成。主要运用了OpenCV强大的图像处理库再结合嵌入式和图像处理的相关技术,在iTop-4412开发平台上搭建了该提取系统,能够实现图像的预览、采集、对所采集的油菜叶片图像进行
近年来,我国互联网规模不断扩大,数据流量呈现出来源分布广、类型复杂多样的特点,给网络性能监测工作带来了困难。论文提出引用核函数空间对传统的主成分分析PCA算法进行改进
针对电商图片背景复杂、水印重叠等问题,论文实现了一种基于特征融合的文本检测模型。该算法先通过50层的残差网络提取输入图像的特征,然后将残差网络得到的每一层不同尺寸的特征图进行特征融合,对特征融合后的特征图进行回归和分类的操作,去除候选区域的提取、过滤和融合等步骤,提高模型的效率。利用改进后的NMS将预测的文本框合并,得到最终的检测结果。为解决非平衡数据的问题以及加快模型的收敛,模型引入了DiceL
苹果小吉丁虫是新疆维吾尔自治区级检疫对象,是毁灭性蛀干害虫,主要寄主是苹果树,其幼虫在树干皮层下左右穿行蛀食,使枝干枯死,当树干周缘树皮被害一圈后,整树干枯死亡。一、
慢性血栓栓塞性肺动脉高压(CTEPH)是肺栓塞的潜在致命结果。目前肺动脉内膜剥脱术(PEA)是首选的治疗方法,但多种因素限制了其临床应用和开展。对于不能行PEA治疗的CTEPH患者,
论文分析了目前网络服务质量综合评价研究现状,通过对比当下主流的网络仿真软件的优缺点,选择OPNET++仿真软件建立网络模型,利用最小二乘法获得最优综合权重并结合标准评价矩
随着车辆保有量不断上升,人们对驾驶安全性行为的关注越来越多。行车数据隐藏了驾驶员的驾驶行为特征,所以对行车数据进行挖掘并分析驾驶员的驾驶行为成为研究热点之一。论文
USB PD协议可以使USB Type-C接口集数据、电能、视频传输于一体,其核心点是通过PD控制器来控制USB Type-C接口中CC线上的数据通信。文中重点研究USB PD协议的PD消息发送和接