【摘 要】
:
目的针对高维冗余的SELDI蛋白质质谱数据,提出一种基于聚类分析和半监督学习的数据分类方法。方法算法首先运用t-test对蛋白质质谱数据进行初步降维;然后将处理后的数据用聚
【机 构】
:
杭州电子科技大学生命信息与仪器工程学院;
【基金项目】
:
国家自然科学基金(60801054,61205200);浙江省自然科学基金(LY12F01005)
论文部分内容阅读
目的针对高维冗余的SELDI蛋白质质谱数据,提出一种基于聚类分析和半监督学习的数据分类方法。方法算法首先运用t-test对蛋白质质谱数据进行初步降维;然后将处理后的数据用聚类分析算法进行进一步降维;最后运用半监督学习算法传递标签,充分提取有标记样本和无标记样本的信息,从而进行分类。结果在公共卵巢癌数据集OC-WCX2b和公共前列腺癌数据集PC-H4上获得了99.15%和96.75%分类准确率。在浙江省肿瘤医院临床乳腺癌数据集BC-WCX2a上获得了95.18%的分类准确率和100%的敏感性。结论基于聚类分析的半监督学习方法能够有效利用未标记的质谱样本信息,与经典的监督学习算法相比,其分类性能更理想、实用性更好。
其他文献
<正>2011年3月29日至4月4日,联合国人道主义事务协调办公室国际救援医疗工作组在哥斯达尼加首都圣何塞召开了国际救援医疗工作组年度会议,全球13位灾害救援医学专家重点对今
随着我军装备技术水平的不断提升,装备知识谱系的交叉拓展,士官队伍在装备保障力生成中发挥着越来越重要的作用,成为决定装备保障力的骨干力量。科学认识士官在装备保障中的骨干
因国家对房地产市场的宏观调控,我国的房地产市场正面临着生存和发展的严峻考验,房地产行业不再是人们眼中的暴利行业,行业的利润正在不断回归社会的正常水平,在这样的大背景
局处级领导干部是南京市改革发展的领导骨干,其思想状况如何,直接关系南京的经济社会发展。本课题在对南京市200多位领导干部问卷调查的基础上,对南京市领导干部的人生价值观
国务院常务会议要求加快落实完善固定资产加速折旧政策,通过减轻税负,加快企业设备更新、科技研发创新,扩大制造业投资等措施,促进产业升级和经济持续稳定增长。固定资产加速
市场要求提高水泥总体质量水平郭道源刘除临一、现状我国水泥总产量虽占世界第一位,人均占有水泥400千克。但是质量能够达到国际一般水平及以上的水泥只有近1.4亿吨,人均占有只115千克,而
文章以佳木斯孟家岗林场的不同年龄、不同密度及不同立地条件的落叶松人工林为研究对象,选取130株样木,测定每株样木15个相对高处的带皮直径,采用非线性回归模型的参数估计方
高等职业教育是我国职业教育体系的一个重要组成部分,其职业性和地方性决定了高职院校具有职业培训功能。高职院校应选择合理路径履行其职业培训功能:构建大职业教育观下的高
<正>高速公路交通的安全问题关系着道路的正常运行和人民群众生命财产的安全。而隧道是整条高速公路的咽喉地段和重点控制工程,它的安全性、可靠性对整个高速公路的快速畅通