语义相似度的基因名标准化方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:qq1123388099
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对生物医学数据库中基因标识符的描述信息不够丰富和完整,不能很好地区分歧义词不同含义的问题,给出了一种基于扩展语义相似度的基因名标准化方法。该方法利用MEDLINE摘要信息和基因本体描述信息,为数据库中的基因标识符生成了扩展的语义信息;然后通过比较歧义基因名的上下文信息和其不同语义描述信息之间的相似性,为歧义基因名确定能够表达真实含义的唯一基因标识符。使用BioCreativeII基因标准化任务的语料,实验结果的准确率达到了80%,召回率达到了82.4%,F值达到了81.2%。从实验结果可以看出,扩展语义
其他文献
考虑到经典粗糙集模型中等价关系过于严格的缺陷和直觉Fuzzy集在处理不确定信息时所具有的表达力,建立了覆盖粗糙直觉Fuzzy集模型,并给出了该模型下的一些性质;接着引入了覆盖粗
耙吸式挖泥船安装水下泵通常是为满足深水取砂疏浚的需要。近年来,随着水下泥泵装置技术的成熟,水下泥泵装置越来越多地应用于航道疏浚作业。相比于舱内泵,安装水下泥泵可有
针对现有检测前跟踪(TBD)算法在多帧间积累时都使用非相参积累,积累效率较低的问题,对相参积累的TBD方法进行了研究。该方法在多帧回波数据下通过数据拼接、回波方位选取、噪声
社团结构分析有助于识别代谢网络中的功能模块,有助于理解代谢网络的结构和功能关系,是代谢网络研究领域的一个重要研究课题。然而,当前的社团结构分析方法均依赖于对网络中
以CNKI作为文献来源,对近10年有关图书馆老年服务研究领域的文献进行计量分析.采用文献计量学的方法,从年发文量、文献来源、发文著者及机构、文献主题内容、文献被引频次等5