提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:陈津勇|2019-10-29 10:31:37.413|阅读 1015 次
概述:在本教程中,您将使用自动化机器学习在Power BI中创建和应用二进制预测模型。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
本教程包括创建Power BI数据流的指导,以及使用数据流中定义的实体直接在Power BI中培训和验证机器学习模型。然后,我们使用该模型对新数据进行评分以生成预测。
首先,您将创建一个Binary Prediction机器学习模型,根据在线购物者的一组在线会话属性来预测他们的购买意图。本练习使用基准机器学习数据集。一旦一个模型被训练,Power BI将自动生成一个解释模型结果的验证报告。然后您可以查看验证报告,并将模型应用到您的数据中进行评分。
学习本教程前,请下载Power BI Desktop或Power BI Pro,以便同步操作加深学习印象。
下载Power BI Desktop 下载Power BI Pro
本教程包括以下步骤:
使用输入数据创建数据流
创建和训练机器学习模型
查看模型验证报告
将模型应用于数据流实体
使用Power BI报表中模型的评分输出
使用输入数据创建数据流
本教程的第一部分是使用输入数据创建数据流。如以下各节所示,该过程采取了一些步骤,从获取数据开始。
获取数据
创建数据流的第一步是准备好数据源。在我们的案例中,我们使用来自一系列在线会话的机器学习数据集,其中一些最终达到了购买目的。数据集包含一组关于这些会话的属性,我们将使用它们来训练我们的模型。
您可以从UC Irvine网站下载数据集。就本教程而言,我们还可以通过提供此功能。
创建实体
要在数据流中创建实体,请登录Power BI服务,并导航到启用了AI的专用容量的工作区。
如果还没有工作区,可以通过在Power BI服务的左侧导航菜单中选择“工作区”来创建一个工作区,然后在出现的面板底部选择“创建应用程序工作区 ”。这将在右侧打开一个面板,以输入工作区详细信息。输入工作空间名称,然后选择高级。使用单选按钮确认工作空间使用“专用容量”,并且已将其分配给已打开AI的专用容量实例。然后选择保存。
创建工作空间后,可以选择“欢迎”屏幕右下角的“ 跳过 ”,如下图所示。
选择工作区右上方的Create按钮,然后选择Dataflow。
选择添加新实体。这将在浏览器中启动Power Query编辑器。
选择Text/CSV File作为数据源,如下图所示。
在接下来出现的“ 连接到数据源”页面中,将以下指向online_shoppers_intention.csv的链接粘贴到“ 文件路径”或“ URL”框中,然后选择“ 下一步”:
//raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv
Power Query Editor显示CSV文件中数据的预览。您可以通过更改右侧窗格中“名称”框中的值,将查询重命名为更友好的名称。例如,您可以将查询名称更改为Online Visitors。
Power Query会自动推断列的类型。您可以通过单击列标题顶部的属性类型图标来更改列类型。在此示例中,我们将“收入”列的类型更改为“真/假”。
选择“保存并关闭”按钮以关闭Power Query Editor。提供数据流的名称,然后在对话框上选择“保存 ”,如下图所示。
创建和训练机器学习模型
要添加机器学习模型,请在“动作”列表中为包含您的训练数据和标签信息的基本实体选择“应用ML模型”按钮,然后选择“添加机器学习模型”。
创建机器学习模型的第一步是识别历史数据,包括您想要预测的结果字段。模型将通过学习这些数据来创建。
对于我们使用的数据集,这是收入字段。选择Revenue作为“输出字段”值,然后选择Next。
接下来,我们必须选择要创建的机器学习模型的类型。Power BI分析您已经确定的结果字段中的值,并建议可以创建哪些类型的机器学习模型来预测该字段。
在本例中,由于我们正在预测用户是否会购买的二进制结果,因此建议使用二进制预测。因为我们对预测用户购买感兴趣,所以选择True作为您最感兴趣的收入结果。此外,您可以为自动生成的报告中使用的结果提供友好的标签,该报告将总结模型验证的结果。然后选择Next。
接下来,Power BI对您的数据样本进行初步扫描,并提出可能产生更准确预测的输入建议。如果Power BI不建议使用该字段,则会在其旁边提供说明。您可以选择更改选择,以仅包括您要模型研究的字段,或者可以通过选择实体名称旁边的复选框来选择所有字段。选择下一步接受输入。
在最后一步,我们必须为模型提供一个名称。将模型命名为“购买意图预测”。您可以选择减少培训时间以查看快速结果,也可以选择增加培训时间以获得最佳模型。然后选择保存并训练以开始训练模型。
培训过程将首先对历史数据进行采样和标准化,然后将数据集划分为两个新实体,即购买意向预测培训数据和购买意向预测测试数据。
根据数据集的大小,训练过程可能需要几分钟到上一个屏幕选择的训练时间。此时,您可以在数据流的“ 机器学习模型”选项卡中看到该模型。就绪状态表示该模型已排队等待训练或正在训练中。
您可以通过数据流的状态来确认正在对模型进行训练和验证。这将在工作区的Dataflows选项卡中显示为正在进行的数据刷新。
模型训练完成后,数据流将显示更新的刷新时间。您可以通过导航到数据流中的“机器学习模型”选项卡来确认模型已训练。您创建的模型应显示为“已训练”状态,并且“最后一次训练时间”现在应该更新了。
查看模型验证报告
要查看模型验证报告,请在机器学习模型选项卡中,选择模型的“操作”列中的“查看培训报告”按钮。该报告描述了您的机器学习模型可能如何执行。
在报告的“ 模型性能”页面中,选择“查看最重要的预测变量”以查看模型的最重要的预测变量。您可以选择一个预测变量,以查看结果分布如何与该预测变量关联。
您可以使用“模型性能”页面上的“概率阈值”切片器来检查其对模型的“精确度”和“调用”的影响。
报告的其他页面描述了该模型的统计性能指标。
该报告还包括“培训详细信息”页面,该页面描述了运行的不同迭代,如何从输入中提取特征以及所使用的最终模型的超参数。
将模型应用于数据流实体
选择报告顶部的“应用模型”按钮以调用此模型。在“应用”对话框中,可以指定目标实体,该目标实体具有应该将模型应用于其的源数据。
出现提示时,您必须刷新数据流才能预览模型的结果。
应用模型将创建两个新实体,后缀分别为<model_name>和<model_name>。在我们的案例中,将模型应用于“在线访问者”实体将创建“在线访问者丰富的购买意图预测”,其中包括该模型的预测输出;以及“在线访问者丰富的购买意图预测”说明,其中包含针对该预测的特定记录最高影响者。
应用二进制预测模型将添加四列,其中包含预测的结果、概率得分、预测的最高记录特定影响者以及解释索引,每列均以指定的列名作为前缀。
数据流刷新完成后,您可以选择“在线访问者充实的购买意图预测”实体来查看结果。
在Power BI报表中使用模型的评分输出
要使用机器学习模型的评分输出,可以使用数据流连接器从Power BI桌面连接到数据流。现在,可以使用“在线访问者丰富的购买意图预测”实体将来自模型的预测合并到Power BI报表中。
*想要获得Power BI Desktop、Power BI Pro更多资源或正版授权的朋友,可以咨询了解哦~
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn
文章转载自:本文探讨 SQL Server 中 NULL 和空值之间的区别,并讨论如何有效地处理它们。
Unity 是一款功能极其丰富的游戏引擎,允许开发人员将各种媒体集成到他们的项目中。但是,它缺少最令人兴奋的功能之一 - 将 Web 内容(例如 HTML、CSS 和 JavaScript)直接渲染到 3D 场景中的纹理上的能力。在本文中,我们将介绍如何使用 DotNetBrowser 在 Unity3D 中将 Web 内容渲染为纹理。
DevExpress v24.2帮助文档正式发布上线了,请按版本按需下载~
本教程将向您展示如何用MyEclipse构建一个Web项目,欢迎下载最新版IDE体验!
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@pclwef.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢