基于改进Attention Mask编解码器CPI的研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:kf_haiyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
化合物-蛋白质相互作用(CPI)的研究对药物发现有着重要作用,它可以为药物靶标选择提供有价值的信息,在一定程度上提高先导化合物的命中率,进而加快药物发现的进程.由此提出了一种基于改进Attention Mask编解码器的化合物与蛋白质相互作用分类的预测模型,分别使用RDkit和Item2vec处理化合物的SMILES字符串和蛋白质的氨基酸序列,将得到的化合物和蛋白质低维特征表示的向量输入到该模型,通过分配权重的方式来计算蛋白质中的哪个子序列对化合物分子更重要,使用带有Attention机制的神经网络计算权重,模拟化合物和蛋白质之间的相互作用关系,最后作为一个二分类问题输出化合物和蛋白质是否相互作用的预测概率.模型性能测评采用ROC曲线下面积、准确召回率曲线作为评价指标,实验结果表明,该模型相比于GraphDTA和GCN模型而言,拥有更好的性能表现,AUC值提高了0.04左右,PRC值提高了0.07左右.
其他文献
铁路工程地质勘察资料数量非常庞大,单条线路的工程地质资料超过1 TB,其中大部分是文档、图像等非结构化数据,这些资料反映了岩土工程特点和地质条件,是工程设计阶段最重要的依据.在项目工期紧和质量要求高的大背景下,传统的资料查阅方式给工程设计人员造成相当大的困扰,急需设计实现一套快速、扩展性强、支持众多文件格式的资料检索系统,以提高资料检索的速度、准确度,同时贴合设计人员使用习惯,以更丰富的检索体验来提高设计工作效率.该文分析了铁路工程地质勘察资料检索的特点,解决了系统设计的架构和处理流程,涵盖了海量、非结构
模拟课堂教学行为的教学优化算法,具有操作简单且搜索能力强的突出优点.尽管该算法为增强种群多样性采取了消除重复个体操作,然而在算法后期依然容易陷入早熟收敛.为提高教学优化算法的搜索能力,该文通过融合涡流搜索和差分进化这两种策略,提出了改进措施.改进后的算法包括:教师自学、向教师学、学生互学三种行为.首先,在每轮循环的开始,增加了基于涡流搜索的教师自学习行为,从而使作为最优个体的教师也获得一定的改进机会.其次,在教师阶段和学生阶段的个体更新式中,均增加了体现不同个体之间差异的差分算子,同时在学生阶段增加了轮盘
2022年国际文化创意中心·中部(长沙)印刷产业博览会将于2022年4月20~22日在芒果馆·湖南国际会展中心举办,再次扩容提质,集合展销印刷包装设备耗材、数码广告设备、广告标识,集中展示印刷行业发展的新理念、新技术、新材料、新设备、新工艺、新产品、新模式以及文化创意产业与印刷产业融合的新亮点、新机遇、新发展,推动长沙印刷业高质量发展.
期刊
由于传统的驾驶员违规接听电话行为检测方法缺乏一套严谨的评判模型,难以满足现实中驾驶员违规接听电话的识别需要,因此如何建立一套合理有效的评判模型成为亟待解决的问题.针对目前评判模型的局限性,采用计算机视觉技术和深度学习模型相结合的方式对驾驶员违规接听电话行为进行科学评判.主要是通过提取的Haar-Like特征训练级联分类器捕获脸部特征,采用CNN模型和ROI技术提取手部特征,并利用YoloV3目标检测算法识别手机,依据特征间的空间位置关系来判断驾驶员是否存在违章接听电话行为.通过大量数据的实验测试,结果证明
镭雕(laser又名激光雕刻、激光打标、镭射打标),镭雕是表面处理的一种工艺,和网印、移印相似,都是在产品上印字或者图案之类,工艺不同,价格有异.但相比之下镭雕有标记速度快,图像标记美观,分辨率高,永不磨损,范围广泛,安全可靠,精确性高,效果一致,高速快捷,成本低廉,防伪性强等优点.
期刊
公司简介rn佛山世科兴远智能装备有限公司(佛山市世科玻璃技术有限公司)成立于2007年,是一家专业研究开发玻璃深加工技术、新工艺及其配套设备制造的综合性高新技术企业.历经数位工程技术人员的多年探索与实践,已成功开发研制出水平辊道式平/弯钢化玻璃生产线、强制对流加热钢化玻璃生产线、全自动智能型连续热弯玻璃生产线等,并已广泛应用于国内外建筑装饰、车辆交通、民用家具、家电、工业仪表等各个领域.
期刊
为了解决油田企业在信息化建设和信息资源管理过程中存在的数据“看不到”、“读不懂”、数据标准不统一、信息孤岛导致数据共享不充分等问题,以实现企业数据资源统一组织管理与开放共享,基于国内外信息资源规划和数据管理成熟理论,设计提出了“业务-系统-数据关联法”摸底梳理企业业务、数据资源和系统现状及需求.从业务入手,梳理企业业务架构以构建油田业务模型,并基于企业标准数据模型结合业务系统数据模型、用户视图与业务需求等分析梳理企业数据资源,设计统一的数据元标准和规范化的企业级数据模型描述数据资源.最后基于数据模型以业务
丝网印刷T恤衫的工艺参数随着印量与图案类型的变化而变化.本文针对印量为100件以上的网目调图案类T恤衫印刷的网版目数、绷网张力、曝光时间、版模厚度以及图像的加网线数进行了数据研究,通过结果比对出适合网目调丝网印刷的T恤衫的工艺参数,对丝网印刷T恤衫的图像精度提升具有重要指导意义.
传统DBSCAN算法对密度分布不均匀的不平衡数据集的聚类效果并不理想,同时传统算法的聚类结果对邻域半径(Eps)以及核心点阈值(MinPts)敏感.针对以上问题,改进了传统算法,提出了一种基于最小生成树的密度聚类算法(MST-DBSCAN).由于对象之间的距离对聚类结果影响较大,为了更好地表示对象之间的距离特性,首先使用相互可达距离(mutual reachability distance)代替传统算法中的欧氏距离,表示数据集中对象与对象之间的距离,解决因密度分布不均匀导致效果不佳的问题;为了建立对象与对
针对药品销售行业传统低效营销方式的缺点,将药店睡眠会员是否容易被唤醒的问题抽象为二分类问题,提出了一种面向药店平台的预测睡眠会员唤醒算法,来解决现有睡眠会员唤醒模型应用于药店睡眠会员用户唤醒的局限性且预测用户到店消费精度不高的问题.从会员的行为、属性、动态三个维度提出多种传统营销特征属性,在多视角的基础上,设计出药品营销的独有特征属性构建出特征集合,将特征集合代入到支持向量机SVM以及XGBoost算法模型并使用Soft Voting方法进行模型融合.通过实验表明,相对于使用传统特征的单一模型,使用集成学