论文部分内容阅读
【摘要】探讨肝癌手术治疗效果问题,对手术的治疗效果进行预测,为病人是否选择手术治疗提供合理的建议。在合理假设的基础上建立逐步回归分析模型,并求解模型。最后得出结论。
【关键词】虚拟变量;回归分析;逐步回归模型;肝癌;手术;预后影响
【中图分类号】R-0【文献标识码】B【文章编号】1671-8801(2014)06-0371-02
一、问题重述
肝癌是我国第二常见的癌症,很多人在发现肝癌时就已经是肝癌中晚期了,而肝癌手术治疗是中晚期肝癌的首选疗法。选取某医院10年来肝癌病例总共4860例,每个病例有病人近80个信息,其中包括患者病历号、性别、年龄、学历、职业、住址、基本病史、临床体征、恶性肿瘤分类、实验室检验指标、影像学检查等,经过数据预处理,选取其中20个有代表性的样本,选取对预后有影响的l0个指标,以预后影响作为评价标准,建立数学模型,对手术的治疗效果进行预测,为病人是否选择手术治疗提供建议。(附表如下)
二、模型假设
1.假设题目所给的数据真实可靠;
2.假设附件中的数据信息均合理。
3.假设肝癌患者的手术预后影响只受选出的10个因素影响。
4.假设患者仅患有肝癌,健康程度不受其他影响。
三、模型的建立与求解
第一步:引入虚拟变量
在回归分析模型中,解释变量均为定性变量的模型称为方差分析模型(analysis-of-variance models)(ANOVA)。现建立人工变量,将定性变量“定量化”,连续变量不变,具体赋值情况如下:
:食道静脉曲张虚拟变量,设
:门脉癌栓虚拟变量,设
: HbsAg虚拟变量,设
: Anti-HCV虚拟变量,设
::肿瘤部位虚拟变量,设
:肿瘤大小虚拟变量,设
:肿瘤生长方式虚拟变量,设
:肿瘤包膜,设
:肿瘤旁的微小子灶,设
:术后腹水,设
:预后影响,设
第二步:建立多元线性回归模型
本题需要研究各个因素与预后影响之间的关系,故建立多元线性回归的一般模型:
Y = b0 + b1X1 + b2X2 + … + b10X10 + ε
其中,b0 ,b1 ,b2 ,… ,b10 是未知数参数,b0 为回归模型的常数,ε为随机误差。假定
ε ~ N( 0 , δ2),
即 E(y)= b0 + b1X1 + b2X2 + … + b10X10
第三步:引入逐步回归模型
进一步的,本题要求找出影响预后影响的主要因素,即从若干变量中选取对预后影响最大的几个因素,并使自变量个数尽量少。为实现这一目标,引入逐步回归模型。
第四步:模型求解
利用MATLAB软件进行模型求解。在MATLAB统计工具箱中的逐步回归命令是Stepwise,利用这个计算工具我们可以方便的完成回归变量的筛选工作。其通常的用法是
Stepwise(x,y,inmodel,alpha),
其中:x是自变量数据,排成m×n矩阵(m为自变量个数,n为每个变量的数据量);y是因变量数据,排成n×1阶数据矩阵;inmodel是自变量初始集合的指标(即矩阵x中哪些列进入初始集合),缺省时设定为x的列数m;alpha为显著性水平,缺省时设为0.05。
四、模型的检验
以X7为例进行模型检验,具体情况如下:
1.运用Excel的数据分析功能进行回归分析得到下表
表一:Excel回归分析数据表
2)读表,得到各种检验结果如下:
标准误差
判定系数R2=0.341414
相关系数r=0.584307
F 检验值为9.849693
3)问题解答
根据上面得到的数据,我们可以得到以下结论:
影响预后影响的主要因素分别为:肿瘤旁的微小子灶、HbsAg、食道静脉曲张、肿瘤部位、术后腹水、肿瘤生长方式以及肿瘤大小。
五、肝癌手术治疗效果评价题报告
通过回归分析法、理论数据、概率分析及主要因素影响等一系列的分析方法,从题中所给出的各组数据中,可以得出对于肝癌患者手术治疗还是很有效的,但是我们仍然要积极预防术后复发,术后复发仍然是影响病人长期生存的主要因素。
首先通过研究,得出术后腹水(少或者无)、肿瘤旁的微小子灶(无)、肿瘤包膜(子灶突破包膜、无)、Anti-HCV(阴性)等易导致有预后影响。
经过定量的分析后,影响预后影响的主要因素分别为:肿瘤旁的微小子灶、HbsAg、食道静脉曲张、肿瘤部位、术后腹水、肿瘤生长方式以及肿瘤大小。
同时我们也发现完善综合性辅助治疗、积极控制肝病的活动与发展、肝癌术后复发非手术治疗方法选择等对于患者术后防止复发有积极作用。
通过此次对某医院的肝癌病例的综合研究,我们对肝病患者有了更深刻的认识,也借此机会希望相关部门能够做好肝病患者手术前后的治疗工作,给患者一个完善的治疗方案和安稳的治疗环境,让患者康复的比例逐渐加大,让术后复发的比例逐渐减小;同时希望人人都能够珍惜生命,关爱病人。
【关键词】虚拟变量;回归分析;逐步回归模型;肝癌;手术;预后影响
【中图分类号】R-0【文献标识码】B【文章编号】1671-8801(2014)06-0371-02
一、问题重述
肝癌是我国第二常见的癌症,很多人在发现肝癌时就已经是肝癌中晚期了,而肝癌手术治疗是中晚期肝癌的首选疗法。选取某医院10年来肝癌病例总共4860例,每个病例有病人近80个信息,其中包括患者病历号、性别、年龄、学历、职业、住址、基本病史、临床体征、恶性肿瘤分类、实验室检验指标、影像学检查等,经过数据预处理,选取其中20个有代表性的样本,选取对预后有影响的l0个指标,以预后影响作为评价标准,建立数学模型,对手术的治疗效果进行预测,为病人是否选择手术治疗提供建议。(附表如下)
二、模型假设
1.假设题目所给的数据真实可靠;
2.假设附件中的数据信息均合理。
3.假设肝癌患者的手术预后影响只受选出的10个因素影响。
4.假设患者仅患有肝癌,健康程度不受其他影响。
三、模型的建立与求解
第一步:引入虚拟变量
在回归分析模型中,解释变量均为定性变量的模型称为方差分析模型(analysis-of-variance models)(ANOVA)。现建立人工变量,将定性变量“定量化”,连续变量不变,具体赋值情况如下:
:食道静脉曲张虚拟变量,设
:门脉癌栓虚拟变量,设
: HbsAg虚拟变量,设
: Anti-HCV虚拟变量,设
::肿瘤部位虚拟变量,设
:肿瘤大小虚拟变量,设
:肿瘤生长方式虚拟变量,设
:肿瘤包膜,设
:肿瘤旁的微小子灶,设
:术后腹水,设
:预后影响,设
第二步:建立多元线性回归模型
本题需要研究各个因素与预后影响之间的关系,故建立多元线性回归的一般模型:
Y = b0 + b1X1 + b2X2 + … + b10X10 + ε
其中,b0 ,b1 ,b2 ,… ,b10 是未知数参数,b0 为回归模型的常数,ε为随机误差。假定
ε ~ N( 0 , δ2),
即 E(y)= b0 + b1X1 + b2X2 + … + b10X10
第三步:引入逐步回归模型
进一步的,本题要求找出影响预后影响的主要因素,即从若干变量中选取对预后影响最大的几个因素,并使自变量个数尽量少。为实现这一目标,引入逐步回归模型。
第四步:模型求解
利用MATLAB软件进行模型求解。在MATLAB统计工具箱中的逐步回归命令是Stepwise,利用这个计算工具我们可以方便的完成回归变量的筛选工作。其通常的用法是
Stepwise(x,y,inmodel,alpha),
其中:x是自变量数据,排成m×n矩阵(m为自变量个数,n为每个变量的数据量);y是因变量数据,排成n×1阶数据矩阵;inmodel是自变量初始集合的指标(即矩阵x中哪些列进入初始集合),缺省时设定为x的列数m;alpha为显著性水平,缺省时设为0.05。
四、模型的检验
以X7为例进行模型检验,具体情况如下:
1.运用Excel的数据分析功能进行回归分析得到下表
表一:Excel回归分析数据表
2)读表,得到各种检验结果如下:
标准误差
判定系数R2=0.341414
相关系数r=0.584307
F 检验值为9.849693
3)问题解答
根据上面得到的数据,我们可以得到以下结论:
影响预后影响的主要因素分别为:肿瘤旁的微小子灶、HbsAg、食道静脉曲张、肿瘤部位、术后腹水、肿瘤生长方式以及肿瘤大小。
五、肝癌手术治疗效果评价题报告
通过回归分析法、理论数据、概率分析及主要因素影响等一系列的分析方法,从题中所给出的各组数据中,可以得出对于肝癌患者手术治疗还是很有效的,但是我们仍然要积极预防术后复发,术后复发仍然是影响病人长期生存的主要因素。
首先通过研究,得出术后腹水(少或者无)、肿瘤旁的微小子灶(无)、肿瘤包膜(子灶突破包膜、无)、Anti-HCV(阴性)等易导致有预后影响。
经过定量的分析后,影响预后影响的主要因素分别为:肿瘤旁的微小子灶、HbsAg、食道静脉曲张、肿瘤部位、术后腹水、肿瘤生长方式以及肿瘤大小。
同时我们也发现完善综合性辅助治疗、积极控制肝病的活动与发展、肝癌术后复发非手术治疗方法选择等对于患者术后防止复发有积极作用。
通过此次对某医院的肝癌病例的综合研究,我们对肝病患者有了更深刻的认识,也借此机会希望相关部门能够做好肝病患者手术前后的治疗工作,给患者一个完善的治疗方案和安稳的治疗环境,让患者康复的比例逐渐加大,让术后复发的比例逐渐减小;同时希望人人都能够珍惜生命,关爱病人。