基于特征加权的蛋白质交互识别

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:a76s333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在以单词为特征的模型中,如果特征单词在不同类别中的使用情况存在明显差异,那么它对分类有着很重要的影响。因此文中基于大规模语料库,研究不同的特征加权方法对PPI识别的影响。首先,通过搜索医学文献数据库建立蛋白质对的签名档,以单词作为描述蛋白质对关系的特征,构建向量空间模型;然后,选择不同的加权方法描述单词重要性;最后,以K近邻和SVM分类方法构建分类器判断蛋白质对是否存在交互关系。实验结果表明,根据特征向量单词的重要性进行加权,PPI识别精确度、召回率和准确率有了明显的提高。
其他文献
随着我国社会经济的不断发展,地方政府投资项目越来越多,国有地方政府平台公司的投融资范围越来越广,平台数量也在不断增加。为了进一步加强国有地方政府平台公司在政府投资
2019年1月1日起全国政府会计主体单位统一执行新会计制度,通过一年多时间运行,操作中存在许多实务问题,笔者通过与省内多位财务同行进行交流,了解到各单位执行制度的相关情况
目的探讨乙型肝炎(乙肝)患染期5种表型中的大三阳、小三阳的患者的谷丙转氨酶(ALT)、空腹血糖(GLU)含量变化相关性。方法 211例乙肝大小三阳患者,其中大三阳83例,小三阳128例,采用
随着计算机技术的飞速发展,各领域存储系统中的数据存储量迅猛上升,而其中的冗余数据也呈不断增加趋势。以往的研究表明,某些存储系统中的冗余数据已达60%,其存储管理成本较高。处
文中主要研究无源测向定位中测向数据关联方法。数据关联是多传感器多目标测向交叉定位中的关键问题,主要作用是快速、准确地确定源于同一个辐射源的测向线。在数据关联方面,有效的方法是多维分配算法。但是多维分配在维度大于2时是一个NP-hard问题。文中针对被动多传感器的量测数据关联问题,提出了一种基于传感器基线分组的快速数据关联算法,通过将三个传感器的量测分成四组进行关联,减少了候选关联集数量,有效提高了
平行泊车技术对驾驶人员来说是众多驾驶技术中比较难掌握的一种,因为在泊车的过程中,一方面驾驶员的视线会受到一定程度的遮挡,另一方面,在倒车过程中驾驶员既要注意规避车辆
随着信息技术的快速发展,业务与财务相互融合的新型财务管理模式得以快速发展,在这种模式下企业打破了财务与业务之间的信息壁垒,大幅降低了信息不对称,全面提升了企业财务管
医院的医疗质量和水平与居民生活需要息息相关,而固定资产作为医院运营的重要载体,加强固定资产管理,并且高效地利用固定资产,影响着医院的长远发展。通过研究发现,医院的固
目的研究阿卡波糖与二甲双胍分别联合格列齐特治疗2型糖尿病(T2DM)患者的疗效对比。方法 150例T2DM患者,按随机数字表法分为对照组和观察组,每组75例。两组患者均进行常规饮食
数字化浪潮席卷全球,数字化校园在中国的大学里方兴未艾,高职院校的设备管理正朝着数字化的方向不断迈进.为加快数字化管理步伐,结合本校实际系统地介绍了设备管理数字化的必