论文部分内容阅读
艾滋病,全名为获得性免疫缺陷综合症(AIDS)。它是由人类免疫缺陷病毒(HIV)引起的一种以导致人类免疫功能缺陷为主要表现的慢性、恶性传染病[10]。HIV是一种反转录病毒,它进入人体后,主要侵犯人体的免疫系统,攻击和杀伤人体免疫系统中起重要作用的CD4+T淋巴细胞,使得CD4+T淋巴细胞功能受损、数量减少,从而使得人体免疫功能遭受严重破坏,使大部分感染者抵抗疾病的能力下降而发生各种机会性感染和肿瘤等,并最终导致死亡。现阶段,国家对艾滋病的防治工作投入了大量的人力、物力;在艾滋病抗病毒治疗方面,更是不断的加大投入和扩大抗病毒治疗的覆盖面,由此在艾滋病抗病毒治疗过程中产生了大量的数据。.随着网路技术和计算机应用技术的发展和普及,社会信息化程度不断提高,在飞速发展的经济时代,迫切需要科学的决策方法和新的管理模式。数据挖掘(Data Mining)能从大量不完全的、有噪声的随机数据中,提取出蕴含在其中的信息和知识,是一种面向应用的技术,在现代医学中,可以应用数据挖掘技术,对大量临床数据(如前面提到的大量艾滋病抗病毒治疗临床数据)进行挖掘来建立相应的模型,进而作为决策时的指南和依据,辅助临床医学诊断,提高诊断的准确性。本文首先介绍了数据挖掘和艾滋病抗病毒治疗的基本知识,并重点分析研究了基于熵的离散化和决策树C4.5算法,然后从某市艾滋病成人抗病毒治疗过程中所产生的数据入手,对患者入组参加抗病毒治疗时的CD4基数进行离散化处理,对比分析不同CD4基数的患者参加抗病毒治疗的效果,并采用决策树算法对影响抗病毒治疗效果的各个因素进行分析。结果显示患者CD4基数在147.5—346.5之间为最佳治疗时机,治疗有效率可达到89.71%,在治疗效果影响因素方面,患者的CD4基数是最重要的影响因素,CD4基数越低,治疗效果越差;而在CD4基数较低时,是否发生过换药行为也是影响治疗效果的一个重要因素,有过换药行为的治疗成功率比没有的高;其次,年龄也是影响治疗效果的一个重要因素,年龄较大的患者通常抗病毒治疗效果会比较差。