论文部分内容阅读
采用面向主题词/副主题词的PubMed数据挖掘软件对从PubMed下载的MEDLINE格式文献的主题词字段进行字符串的查询统计,以达到数据挖掘的目的.该软件主要有三个方面的功能:分析主题词与副主题词的频次、频率以及主题词与副主题词的组配关系,可以进一步对下载的记录进行主题词/副主题词之间的组配检索;分析关于某类事物(如药物或治疗过程等)在不同时间段的分布情况;通过对一组相同类型的不同事物间(如多个药物或治疗过程等)发表文献的比较,得到这些事物的相似度.