彩票走势图

使用CART作为替代方法来分析分类调查数据

翻译|行业资讯|编辑:况鱼杰|2020-05-11 14:37:40.960|阅读 460 次

概述:本文将会介绍利用CART®分类树和回归树的功能解决使用Minitab Statistics软件中的回归分析数据时,结果变量是分类变量而不是定量变量时,对逻辑回归的结果进行解释不是很直接或直观的问题。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

对于所有的服务行业或者医疗行业,在试图了解客户或患者的行为这方面都可能具有挑战性。所以研究人员通常会使用调查数据,并经常使用Minitab Statistics软件中的回归分析数据。但是,当结果变量是分类变量而不是定量变量时,对逻辑回归的结果进行解释不是很直接或直观。

对于以上问题就需要在Minitab中分析调查数据的另一种选择,利用CART®分类树和回归树的功能,这是一种基于树的说明性机器学习技术,最新版本的Minitab Statistics软件现在可以使用它。

点击立即下载Minitab

什么是CART

CART是一种决策树算法,通过创建一组是或否规则进行工作,该规则根据预测变量或输入设置将目标变量或结果变量划分为多个分区。结果模型以决策树的形式显示,该树说明了如何根据输入设置对目标变量或结果变量进行分区。Minitab的CART算法会自动找到最佳的终端节点数(也称为拆分或最终分组),以最大化模型的预测能力。

而选择这个方法的好处是什么呢?分析完成后,CART的输出将具有直观的视觉解释,因此您不必成为数据科学家即可从数据中获得有价值的见解。

Node Split View of CART

注意:Minitab默认情况下显示详细的CART树。右键单击树,然后选择“节点拆分视图”以查看上方的压缩视图。

利用CART充分利用步入式临床数据

现在我们了解了CART是什么,让我们看看它是如何工作的。

步入式诊所链从患者那里收集调查数据,询问患者将来再次使用诊所的可能性:非常可能,有点可能或不太可能。工作人员还记录了患者的年龄,从家到诊所的距离(英里)和就业状况。诊所的区域经理特别想了解影响步行患者再次使用诊所服务的可能性的因素。

数据的一部分显示在下方,而条形图则表示诊所的门诊病人给出的响应。

Data entered by clinic Bar graph of responses from clinic survey

CART可用于预测分类结果的可能性,在这种情况下,这是患者返回诊所的可能性。Minitab的CART分类引擎提供了一个直观的界面,可以处理二进制结果(两组)或多项式结果(三个或更多组)。

经理将数据输入Minitab后,她选择Stat> Predictive Analytics>CART®分类,并显示以下内容:

CART Classification - Selection Box

由于存在三个或更多的组,因此她选择了多项式响应,然后选择“Return Apt”作为响应或要预测的目标。她通过连续预测变量和分类预测变量或她将用来进行预测的输入快速输入来完成此框。

CART自动处理缺失值,对极端离群值不敏感,并且没有要检查的分布,p值或残差假设,这使得CART易于使用,即使对于初学者也是如此。此外,Minitab的CART功能会仔细地将数据分为两类: 部分数据将用于构建模型(学习数据),而其他数据用于评估模型做出新预测的能力(测试数据)。

CART分析的输出显示每个目标变量对的(ROC)曲线下的面积值在0.93或更高。ROC帮助经理可视化了她的模型可以很好地预测患者重返诊所的可能性。该图显示了灵敏度(正确预测为阳性的阳性)与特异性(正确预测为阴性的阴性)之间的关系。

ROC值为0.70或更高通常被认为对大多数应用有用,因此经理很高兴找到一个可以如此准确地预测患者将来重返诊所的可能性的模型。

经理以前曾假设患者离诊所的距离是一个人回访可能性的最佳预测指标。令她惊讶的是,事实并非如此。CART的相对变量重要性图清楚地显示了每个预测变量在确定患者是否会返回诊所中的相应意义。


最终结果

快速评估上面的可变重要性图,发现患者的年龄是他们再次使用诊所的可能性的最佳预测指标,其次是距离,最后是就业状况。

CART分类洞察力对患者行为的洞察力帮助诊所的区域经理为最有可能返回诊所的客户创建了个人资料,因此中心可以提供更多文献资料和激励措施,以确保他们的返回。例如,居住在距诊所不到11英里的43岁以下患者中,无论其就业状况如何,他们都有可能返回。年龄在82岁以下但年龄在71岁以上的患者可能会返回,而无论距离或工作状况如何。相比之下,年龄在67岁至71岁之间的人如果住在距离诊所11英里以上的地方,则无论其他因素如何,他们都不太可能返回。

Minitab Statistics软件中基于树的机器学习算法具有广泛的应用程序,可能有助于找到组织中业务问题的答案。如果您尚未开始,我们邀请您立即开始Minitab的免费试用!

您或许想要了解:

甚至专家都不知道的Minitab使用小技巧,你确定不来看看?

整理决策树以撰写论文:Minitab中的预测分析和根本原因分析


Minitab快速入门

标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn

文章转载自:minitab

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP