HotDataSpider,一个生物医学文献热点数据自动化抽取工具

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:HDGKD30
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术期刊中的附加数据是进行数据分析和文本挖掘的重要依据,具有的分散性、多样性和时效性的特点,难以管理和维护,文章将这类数据称HotData。HotDataSpider以生物医学类文献为研究对象,对生物信息学领域15本国际权威期刊提供的附加数据进行分析,实现了自动抽取、转换,最终将整理好的数据集批量导入到上海生物信息技术研究中心提供的HotData主题数据库中。
其他文献
RFID技术如今已经在诸多领域得到广泛应用,RFID中间件在整个RFID应用体系中扮演重要角色,其负责控制阅读器读取标签数据并与企业应用程序进行交互。Savant是比较通行的RFID中间件架构标准,文章详细分析和阐述了Savant的实现机制和技术规范,并针对Savant的不足和缺陷提出基于Web Services的RFID的中间件的设计和实现。文章最后给出了该方案具体的体系结构和实现方法。
以经典两回路过载自动驾驶仪作为研究对象,将设计参数解析解作为初值,以系统的相对稳定性作为约束条件,以系统响应的过渡过程作为优化目标,建立了排除初值干扰的驾驶仪参数多
专家评估是进行投资决策的手段之一,但由于多采用模糊评价,很难形成规范的系统来实现这一决策过程。而决策过程中产生的大量数据,以人力来计算既无法保证其正确性,又相当费时。因
儿子咳嗽.医生检查之后说:“感冒.我给他开一瓶小儿咳嗽糖浆.吃完就好。”
Fuzzing是一种利用黑盒测试思想的自动化漏洞挖掘技术。文章基于Fuzzing的漏洞挖掘思想,设计并实现了一个针对PNG文件查看软件的fuzz工具-PNGFuzzer,可以实现对PNG文件的漏洞
供应链是多个组织的共同增值网络,对市场需求的预测是供应链上各个节点企业的重要工作之一,而缺乏有效的需求信息预测与共享则是供应链运作效率低下的主要原因之一。在分析GM
以自制的3,5-二氨基-1,2,4-三唑为原料,经反应后依次获得3,5-二硝基-1,2,4-三唑及3,5-二硝基-1,2,4-三唑钾盐(DNTK),用IR、1HNMR、13CNMR及元素分析等手段对其进行了表征,培
针对临近空间高速飞行器防御问题,对该类飞行器运动状态估计算法进行了研究。首先,分析了临近空间高速目标机动模型;然后,建立了雷达观测模型,研究了基于交互式多模型的SRCDK
我国将开展提高农村儿重大疾病医疗保障水平试点,农村儿童患白血病或先天性心脏病等重大疾病,90%的医疗费用将能够通过保障制度得到报销和补偿。
目的分析糖尿病合并急性阑尾炎患者的临床治疗方法及其治疗效果。方法2010年1月—2017年2月,于该院收治的糖尿病合并急性阑尾炎患者中选取90例,随机将其分为两组,传统开腹阑