数据挖掘在中药专利数据集中的应用与研究

来源 :江苏大学 | 被引量 : 4次 | 上传用户:cnzzzbjzbgs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中药是我国的国粹,经过上千年的发展,积累了大量的数据,以往对于这些数据的应用,仅仅是提供一些简单的搜索及统计功能,中医药数据中蕴涵的信息未得到很好的利用。随着世界性回归自然潮流的推进,天然药物的开发越来越受到人们的重视,这为中药的发展提供了一个很好的机遇。如何从包罗万象的中药数据库中发现有价值的信息,以增加中药的科技含量,已成了中药信息化研究的重点。 本文阐述了在中医药专利信息平台上实现知识发现系统的过程,主要包括了方剂信息数据预处理、发现配伍规律和辅助决策三个模块。 针对中药专利的数据特点,以PIDP(方剂信息数据预处理,Prescription Information’s Data Preprocessing)过程规范方剂数据:1、用正交分离的方法对方剂长文本字段进行处理,使方剂中的各味草药独立存储;2、利用中药词典,解决了目前普遍存在的中药异名问题;3、以模糊集描述实际药剂用量。 本文改进了T.P.Hong等提出的FTDA算法,并在此基础上提出FTDA2算法,该算法仅考察对支持度有贡献的项,有效降低了从方剂事务数据库中提取出关联规则的时间复杂度,从规范化方剂数据中提取中药配伍规律,组建模式/规则库。 在模式/规则库的基础之上,系统实现了辅助决策模块,成功地为医学研究人员在研制新型复方中药的过程中提供参考依据。 论文的创新之处在于: 1、本文提出的FTDA2算法,用于在含有数值属性的事务数据集中发现模糊关联规则。与已有算法FTDA相比,在计算k-项候选集时,两种算法的时间复杂度比值为:T(FTDA2)/T(FTDA)≈1/(2k),从而有效降低了时间复杂度。 2、针对系统对方剂长文本处理的需要,设计了符合中药方剂数据特征的PIDP过程,将原始的方剂数据规范化。对方剂长文本进行正交分离,并对不同的属性采用不同的策略:药名异名处理,药剂量模糊化处理。 3、将数据挖掘较为深入的应用到中药研发过程中,弥补现有中药信息系统功能单一的不足,为医学工作者进行决策提供参考。系统提供两大辅助功能:一
其他文献
XML(Extensible Markup Language,可扩展标记语言)是W3C(万维网)于1998年2月推出的一种标记语言。由于其独特的技术优势,XML推出后很快就成为网络中数据表示及交换的标准。因
实时系统的正确性不仅仅体现在程序执行的结果,还体现在任务的执行时间。其任务的执行如果不能满足对截止时间的要求,会降低系统服务的级别,甚至造成系统的崩溃。因此获得任务的
现在软件复用技术的研究已经取得了阶段性成果,构件技术更是发展迅速。基于构件的软件工程(CBSE)已经是软件行业描述最多的术语,利用现有的构件快速地进行应用系统的开发也是
传统的工作流技术局限于组织内部的应用集成,对跨组织之间的互操作缺乏有效的支持,但是随着互联网的迅速发展,跨越组织的业务往来越来越频繁,对组织之间进行协同工作能力的要求也
随着近年来Internet的迅猛发展,传统意义的数据传输已经不能满足人们的需求,多媒体综合数据通信的业务已经应用得越来越广泛了,然而,网络安全始终是IP网络中一个重要的话题,
我国要保持强大的的国防力量和军事威慑手段,军队必须进行经常性的训练。现代战争规模越来越大,综合性越来越强,科技水平越来越高,耗费资金越来越多,军事训练随之发生同样的变化。
  随着医学影像在临床的成功应用,图像分割在医学影像处理中的地位越来越重要。分割后的医学图像正被广泛应用于各种场合,如三维重建、计算机引导手术、手术模拟、治疗规划、
访问控制是指通过某种途径,允许或限制访问能力及其范围的一种方式。信息系统通过实施访问控制,可以限制对关键资源的访问,防止非法用户的侵入或者因合法用户的不慎操作所造
网格代表着一种先进的分布式计算基础设施,它是一个集成的计算与资源环境,其中吸纳了各种各样的计算资源,并将它们转化为可靠、标准且经济的计算能力。网格技术支持在动态、
本文重点研究了SIP协议的消息流程及消息的内容,以及SIP协议具体的应用情况,研究了其中的端系统测试方法及用于描述抽象测试用例的TTCN语言,对比分析了几种端系统测试方法及适用