在 Power BI Desktop 中导入和分析网页中的数据(上)
使用 Power BI Desktop 从数据获得见解,然后进行相关操作利用可视化分析免费创建内容丰富的交互式报表,一切尽在指尖。
如果是一个资深球迷,他想要获得多年来欧足联欧洲锦标赛(欧洲杯)获胜队的报导。他该怎么做呢?使用 Power BI Desktop,可以将此数据从网页导入到报表,并创建显示数据的可视化效果。 在本教程中,将学习如何使用 Power BI Desktop 完成以下操作(由于内容过多,本次内容分为上下篇发布。点击查看下篇>>):
- 连接到 Web 数据源并在可用表之间导航。
- 调整并转换 Power Query 编辑器中的数据。
- 命名查询并将其导入 Power BI Desktop 报表。
- 创建和自定义地图和饼图可视化效果。
连接到 Web 数据源
你可以从 //en.wikipedia.org/wiki/UEFA_European_Football_Championship 处的欧足联欧洲锦标赛维基百科页面上的结果表中获得欧足联获胜队的数据。
仅使用基本身份验证建立 Web 连接。需要身份验证的网站可能无法正常使用 Web 连接器。
若要导入数据,请执行下列操作:
- 在 Power BI Desktop“主页”功能区选项卡中,下拉“获取数据”旁边的箭头,然后选择“Web”。
备注:你还可以选择“获取数据”项本身,或者从 Power BI Desktop“开始”对话框中选择“获取数据”,再从“获取数据”对话框的“所有”或“其他”部分中选择“Web”,然后选择“连接”。
- 在“从 Web”对话框中,将 URL //en.wikipedia.org/wiki/UEFA_European_Football_Championship 粘贴到“URL”文本框,然后选择“确定”。
- 在连接到维基百科网页后,“导航器”对话框会在页面上显示可用表的列表。 可以选择任意表名称以预览其数据。“结果[编辑]”表具有所需的数据,尽管它不完全是你希望的外观。你将可以先重新修整并清理数据,然后再将其加载到报表中。
备注:“预览”窗格只显示最近选择的表,但当选择“转换数据”或“加载”时,所有被选中的表都会加载到 Power Query 编辑器中。
- 选择“导航器”列表中的“结果[编辑]”表,然后选择“转换数据”。
- 表的预览将在“Power Query 编辑器”中打开,你可以在其中应用转换以清理数据。
在 Power Query 编辑器中修整数据
通过仅显示年份和获胜的国家/地区,使数据更易于扫描。使用 Power Query 编辑器执行这些数据修整和清理步骤。
首先,从表中删除除这两项之外的所有列。 在此过程中,稍后将这些列重命名为“年份”和“国家/地区”。
- 在“Power Query 编辑器”网格中,选择列。 按 Ctrl 选择多个项目。
- 右键单击并选择“删除其他列”,或者从“主页”功能区选项卡中的“管理列”组选择“删除列” > “删除其他列”,以从表中删除所有其他列。
或者
接下来,从第一列单元格中删除额外的词“详细信息”。
- 选择第一列。
- 右键单击并选择“替换值”或从功能区“主页”选项卡中的“转换”组中选择“替换值”。 在“转换”选项卡中的“任何列”组中也可以找到此选项。
或者
- 在“替换值”对话框中,在“要查找的值”文本框中键入“详细信息”,“替换为”文本框保持为空,然后选择“确定”从此列中删除“详细信息”一词。
某些单元格仅包含“年份”一词而不是年份值。 你可以筛选列以仅显示不包含“年份”一词的行。
- 在列上选择筛选器下拉箭头。
- 在下拉菜单中,向下滚动并清除“年份”选项旁边的复选框,然后选择“确定”。
因为你现在只查看最终获胜队数据,可以将第二列重命名“国家/地区”。 若要重命名列,请执行下列操作:
- 双击或点击并按住第二列标题,或者
- 右键单击列标题并选择“重命名”,或
- 选择 *列,从功能区的“转换”选项卡中的“任何列”组中选择“重命名”。
或者
- 标题中键入“国家/地区”,然后按 Enter 重命名列。
你还想在“国家/地区”列中过滤掉类似“2020”这样包含 null 值的行。 你可以像处理“年份”值那样使用筛选器菜单,也可以:
- 在具有 null 值的“2020”行中右键单击“国家/地区”单元格。
- 在上下文菜单中选择“文本筛选器” > “不等于”以删除任何包含该单元格的值的行。
由于内容过多,本次内容分为上下篇发布。点击查看下篇>>
想要购买Power BI Desktop正版授权,或了解更多产品信息请点击
关注慧聚IT微信公众号 ???,了解产品的最新动态及最新资讯。