在 Power BI Desktop 中调整和合并数据(一):调整数据(下)
使用 Power BI Desktop 从数据获得见解,然后进行相关操作利用可视化分析免费创建内容丰富的交互式报表,一切尽在指尖。
- 连接到任意数据
- 轻松准备数据并建模
- 借助 Excel 的熟悉度提供高级分析
- 创建为你的企业量身打造的交互式报表
- 随时随地人人创作
合并数据
有关各州的那份数据很有趣,而且适用于生成其他分析工作和查询。 但是有一个问题:大多数数据使用两个字母的州名代码缩写,而不是该州的完整名称。所以需要某种方式来建立州名及其缩写的关联。
仙子是有另一个公共数据源可执行该项工作的,但还需要进行相当多的调整,才能连接到退休表。若要调整数据,请执行以下步骤:
- 从查询编辑器的“开始”功能区中选择“新源”>“Web” 。
- 输入州缩写的网站地址 //en.wikipedia.org/wiki/List_of_U.S._state_abbreviations ,然后选择“连接” 。
- 导航器显示网站的内容。
- 选择“代码和缩写” 。
要将该表的数据缩减到所需的范围,将需要进行大量的调整。是否有更快或更容易的方法完成以下步骤? 有的,我们可以创建两个表之间的关系并基于该关系调整数据。以下步骤对了解表的用法仍非常有用;但关系可以帮助你快速使用来自多个表的数据。
若要对数据进行调整,请执行以下步骤:
- 删除首行。因为它是网页表格创建方式的结果,不是所需的行。从开始功能区中,选择减少行 > 删除行 > 删除前几行。
将显示删除前几行窗口,让你执行要删除几行。
备注:如果 Power BI 意外导入表标题作为数据表中的行,可以从“主页” 选项卡,或者从功能区的“转换” 选项卡选择“将第一行用作标题” ,以便修复表。
- 删除底部的 26 行。 这些行的内容是美国区域,不需要包括这些行。从开始功能区中,选择减少行 > 删除行 > 删除后几行。
- 由于 RetirementStats 表没有针对华盛顿特区的信息,需要将其从列表中筛选去除。选择“区域状态”下拉箭头,然后清除“联邦特区”旁边的复选框 。
- 删除一些不需要的列。 因为只需将每个州映射到其两个字母的官方缩写,因此可以删除下面的列:列 1、列 3、列 4,及列 6 到列 11 。首先选择“列 1”,然后按住 Ctrl 键并选择要删除的所有其他列 。从功能区的“开始”选项卡上,选择“删除列”>“删除列”
备注:
此时非常适合指出,查询编辑器中已应用步骤的序列很重要,可能会影响数据调整方式。同时也必须考虑一个步骤对另一个后续步骤可能会有什么影响;如果你从“所应用步骤”中删除一个步骤,则由于查询中步骤序列的影响,后续步骤可能不会按原本所期望的进行操作。
如果将查询编辑器窗口大小重设为宽度缩小,部分功能区项会进行简缩,以充分利用可视空间。在增加查询编辑器窗口的宽度时,功能区项将展开以充分利用已增加的功能区区域。
- 重命名列和表。 可通过多种方法重命名列:首先,选择该列,然后从功能区的“转换”选项卡中选择“重命名”,或右键单击并选择“重命名” 。下图具有指向这两个选项的箭头;只需任选其一。
- 将列重命名为“州名”和“州代码” 。若要重命名表,请在“查询设置”窗格中输入名称 。将此表命名为 StateCodes 。
现已按所需方式对 StateCodes 表进行了调整,接下来将这两个表或查询合并成一个表或查询。由于现有的表是针对数据应用查询后的结果,因此这些表通常称为“查询” 。
有两种主要方法可合并查询:合并和追加 。
- 当你有一列或多列要添加到另一个查询时,你可合并这些查询。
- 当你有其他列要添加到现有查询时,你可追加查询。
- 在查询编辑器的左窗格中,选择要将其他查询合并到其中的查询 。在本例中选择 RetirementStats 。
- 从功能区的“开始”选项卡中,选择“合并”>“合并查询” 。
- 系统可能会提示你设置隐私级别,以确保对数据进行合并,且不包括或不传输无需传输的数据。随即显示“合并”窗口 。这提示你选择想要合并到所选表中的表格,以及要用于合并的匹配列。
- 从 RetirementStats 表中选择“州”,然后选择“StateCodes”查询 。
- 选择了正确的匹配列后,会激活“确定”按钮 。
-
选择确定。查询编辑器在查询的结尾创建 NewColumn 列,其中包含与现有查询合并的表(查询)的内容 。 已合并查询中的所有列将压缩到 NewColumn 列中,但你可以扩展表,使之包含所需的任何列 。
-
若要扩展已合并表格,并选择要包含的列,请选择扩展图示(“扩展”图标)。展开窗口随即出现。
在本例中,我们只需“州代码”列 。 选择该列,清除“使用原始列名作为前缀”,然后选择“确定” 。
如果选中了“使用原始列名作为前缀”的复选框,合并的列将命名为“NewColumn.State Code” 。
备注:
想了解如何引入 NewColumn 表?你可以试验一下,如果不喜欢结果,只需从查询设置窗格中所应用步骤列表删除该步骤,你的查询便会回到应用展开步骤之前的状态。 你可以不限次数地任意执行,直到展开过程看起来是你要的方式为止。
现在,我们在单个查询(表)中组合了两个数据源,每个数据源都已根据需要进行调整。 此查询可以作为许多其他相关数据连接的基础,例如任何州的住房成本统计数据、人口统计数据或工作机会。
-
若要应用更改并关闭查询编辑器,请从“主页”功能区选项卡中选择“关闭并应用” 。转换后的数据集将在 Power BI Desktop 中显示,可随时用于创建报表。
本教程就到这里了,敬请期待后续内容~感兴趣的朋友可以点击下载Power BI Desktop免费尝试
相关内容推荐:
想要购买Power BI Desktop正版授权,或了解更多产品信息请点击
关注慧聚IT微信公众号 ???,了解产品的最新动态及最新资讯。