联合聚类非线性相关的时序基因表达数据

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:zl6273008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为聚类非线性相关的数据对象,引入广义信息论中二次互信息作为相似性度量,利用矩阵理论降低了二次互信息的计算量,并结合滑动窗口技术,建立了一种时序数据非线性相关模型.在此基础上提出了适用于时序基因表达数据的确定性联合聚类算法MI—TSB.该算法将时序数据转化为抽象字符序列,然后插入到MI-泛化后缀树中,避免了穷举各种组合,从而快速索引全部聚类结果.实验结果显示MI—TSB算法具有良好的运行性能,成功聚类出非线性相关的对象;利用Gene Ontology对聚类结果进行基因注释,也验证了聚类结果的生物学意义.
其他文献
流形学习是多个领域的重要研究课题.通过考察各种流形学习方法,提出了一种新的流形学习方法的统一框架,并在此框架下对拉普拉斯特征映射方法(Laplacian eigenmap,LE)进行了分析.进一
锤击打入式PHC管桩施工从桩机、桩锤选择,到插桩、沉桩、接桩、送桩、收锤等各个施工环节,每步都影响着管桩的施工质量。在台山核电南生活区工程施工中,针对锤击PHC管桩的施工特