基于词典法和机器学习法相结合的蛋白质名识别

来源 :计算机与应用化学 | 被引量 : 0次 | 上传用户:xujc8639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物实体名识别对生物医学文献的信息抽取有重要的意义。本文针对如何识别蛋白质名进行了有益的尝试,主要采用了基于词典的方法,其中运用了近似搭配算法和首词查询的方法进行蛋白质名识别,同时结合机器学习方法训练了一个分类器来过滤候选词以提高识别的准确率。 Identification of biological entities is of great significance to the information extraction of biomedical literature. In this paper, a useful attempt is made to identify protein names. The lexicon-based method is mainly used to identify protein names by using the collocation algorithm and the first word query, and a classifier is trained in combination with the machine learning method to filter the candidate Words to improve the recognition accuracy.
其他文献
河北平原地区是全国最缺水的地区之一,并且年降水量不断减少,水资源的亏缺已成为河北平原农业高效持续发展的重要限制性因素。水资源不足限制了该地区的农业生产,施肥不合理是制约水分潜力发挥的主要原因之一。在一定条件下,施肥可以大幅度提高作物的水分利用效率,因此农业中水分和养分的关系问题当前农业的研究热点。水肥耦合是争取作物高产优质高效的必由之路。因地制宜调节水分和肥料,使水肥产生协同作用,达到“以水促肥”
在我国经济发展转型的关键时期,“十三五”阶段我国将加强新农村建设,不断改善农村条件,吸引农村人口在家就近就业。旧村改造项目是新农村建设项目的重点项目之一,旧村改造项目能
由于患者肾功能衰竭,使人体产生的代谢产物不能通过肾脏排出体外,只能透过透析来排除过多的水分,钠,钾等离子和代谢产物,而透析并不能完全代偿肾脏的功能,因此通过对血液透析
目的:探讨小儿气管异物取出术围手术期的护理要点.方法:回顾性分析2010年1月到2011年1月在我院耳鼻喉科就诊治疗的1000例小儿气管异物患者的临床资料及围手术期的护理资料.结
前列腺增生是老年男性一种常见疾病,其发病率随年龄增高而递增.目前,由于我国的人均寿命不断增长,前列腺增生患者也逐渐增多,已成为泌尿外科的一个重要课题,而经尿道前列腺等
目的:浅谈在普外科实施优质的护理的相关体会.方法:转变普外科护理人员的工作观念,开展优质护理方法,对患者的预后转归及满意度进行评估调查.结果:自普外科开展优质护理服务
报界同行都深深感到最难办的还是要闻版。作为晚报,也是如此。那么,采取什么办法和措施,把要闻版办活呢?(-)读者对象决定报道内容。党委机关报以指导工作为主要内容,它的读者对象显然
门诊输液室是医院的窗口,是医院联系社会的“桥梁”,是人群相对集中、流动性较大的场所,门诊输液具有给药迅速、刺激小、疗效快等优势,已成为医生和患者选择较广泛的治疗方法
产后出血是引起产妇死亡的重大原因之一,也是产科常见而严重的并发症之一.笔者通过对临床55 例产后出血病历的观察,发现因不良心理因素而导致不同程度产后出血42 例.故患者因
目的 探讨护理干预对晚期肺癌患者呼吸困难的影响.方法将我院2010 年3 月~2011 年3 月收治的96 例晚期肺癌患者随机分为观察组和对照组,对照组给予常规护理,观察组在常规护理