彩票走势图

Minitab小技巧:3种功能使您能够尽快准备在Minitab中进行分析的数据

翻译|使用教程|编辑:况鱼杰|2020-08-18 11:24:09.203|阅读 1250 次

概述:有时候您在使用Minitab时可能必须清理数据,这是一件很麻烦的事,而本文就为您介绍3项在Minitab统计软件中可执行的有用操作:更改数据类型,编写代码并删除缺失值以及重新编写变量。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

Minitab Statistical Software是一款无与伦比的可视化统计分析软件,它会审视当前及过往的数据,以找出趋势并预测规律、发现变量之间隐藏的关系、可视化数据交互作用并识别重要因素,从而解答最棘手的问题、应对最严峻的难题。

点击立即下载Minitab


Minitab中,是需要清理数据的,这是一件很麻烦的事,而本文就为您介绍3项在Minitab统计软件中清理数据可执行的有用操作:更改数据类型,编写代码并删除缺失值以及重新编写变量。为了举例说明,将使用Medicare和Medicaid Services中心的一些数据。数据为2008年10月至2009年9月的数据,跟踪医院对肺炎患者的反应质量。PDF文件中的数据如下所示:

如果将其复制并粘贴到Minitab中,希望找到文档中显示的组织良好的表,则会得到一个包含所有内容的列:

标题文本和表内容都在同一列中。


变更资料类型


真正需要分析的是表格中的数字,因此第一步是获取数字。

  • 选择“ 数据”>“更改数据类型”>“文本到数字”。
  • 在“ 更改文本”列中,输入C1。
  • 在“将数值存储在”中,输入C2。
  • 单击确定。在错误框中,单击取消。

当您查看工作表时,粘贴后具有文本值的单元格现在缺少值符号,并且表中的数字仍然保留。您可能会有些不安,接受治疗的患者百分比全为1,但这只是列格式的结果。


删除缺失值


您可以轻松摆脱这些数据中的缺失值,以使缺失值不会干扰进一步的分析,但是这里还有一个附加的麻烦。尽管大多数缺失值是不希望在数据中使用的列标题,但表本身包含一些缺失值。每当医院对少于10位患者进行治疗时,表中就会包含“低样本(10个或更少)”值。为了保留这些缺失值,同时消除其他缺失值,需要使用不同的值来表示数据中的不同情况。

  • 选择“ 计算”>“计算器”。
  • 在将结果存储到变量中,输入C3。
  • 在表达式中,输入If(Left(C1,3)=“ Low”,99999999,C2)。
  • 单击确定。

现在您有两种缺失值,可以开始清理它们。首先,去除那些不代表表中值的值。

  • 选择“ 数据”>“复制”>“列到列”。
  • 在“从以下位置复制”列中,输入C3。
  • 在“将复制的数据存储在列中”中,选择“ 在当前工作表中,在列中”,然后输入C4。
  • 单击“ 分组数据”。
  • 在“ 指定要包括的行”中,选择“ 匹配的行”,然后单击“ 条件”。
  • 在“ 条件”中,输入C3 <>'*'。
  • 在所有对话框中单击“ 确定”。

现在我们已经摆脱了表中不是数字的缺失值,我们可以将缺失值更改为Minitab可以识别的形式。

  • 选择“ 计算”>“计算器”。
  • 在将结果存储到变量中,输入C5。
  • 在表达式中,输入If(c4 = 99999999,'*',c4)。
  • 单击确定。


重新编码数据


为了进行分析,需要每家医院排成一行。为此,将在工作表中创建一个表,该表显示如何识别要分析的变量,然后拆开变量。因为保留了表格中的缺失值,所以每个医院都有9个变量。在工作表中创建一个表格,其中显示数字1到9以及每个变量的名称:

一个表,其中包含要用于变量的数字代码和标签。

为了将变量名与所有1,944行数据相关联,将创建模式数据。

  • 选择“ 计算”>“生成带图案的数据”>“简单数字集”。
  • 在“将模式数据存储在”中,输入C8。
  • 在“ 从第一个值开始”中,输入1。
  • 在“最后一个值”中,输入9。
  • 在“ 列出次数”序列中,输入216。
  • 单击确定。

要将数字代码转换为文本变量描述,我们将重新编码数据。

  • 选择“ 数据>代码>使用转换表”。
  • 在以下列的代码值中,输入C8。
  • 在“ 当前值”中,输入C6。
  • 在“ 编码值”中,输入C7。
  • 单击确定。
现在您已经有了一个列来说明哪个数字属于每个变量,请对数据进行堆栈。
  • 选择“ 数据”>“不堆积列”。
  • 在“ 将数据放入堆栈中”中,输入C5。
  • 在“ 使用下标中”中,输入C9。
  • 单击确定。

现在,您有了一个新的工作表,其中每个医院都通过其唯一的CCN进行标识,变量是从该医院接受每种治疗的肺炎患者的比例。数据以传统格式进行分析后,即可开始快速获取所需的答案。例如,Laney P'图可能表明某些医院的未接种肺炎患者比例是否比您从数据变化中所期望的比例更高。与稳定过程中随机抽样的结果相比,今年有8家工厂的比例更高。

能够更改数据类型,删除缺失值和重新编码数据,使您能够尽快准备好要在Minitab中进行分析的数据。


Minitab是做质量分析的工具,不知道您是否有产品质量这方面的困扰呢?不妨试试产品质量分析及预测方案吧!点击咨询在线客服


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP