彩票走势图

产品

产品
资讯
资源
视频
学院
示例

产品中心
解决方案
行业方案
视频课程
关于慧都

热门产品

UI界面: DevExpress telerik BCGSoft Developer Machines

文档管理: Aspose E-iceblue GrapeCity PDFlib

图表控件: LightningChart Steema Iocomp

数据采集: TAKEBISHI Matrikon

思维导图: TheBrain XMind

开发工具: IntelliJ IDEA MyEclipse Zend PyCharm WebStorm CLion

报表控件: Fast Report Stimulsoft GrapeCity

加密解密: VMPsoft Eziriz Oreans

项目管理: DHTMLX NETRONIC

数据库管理: Devart PremiumSoft

条码工具: Bartender Softek Dynamsoft TEC-IT Byte Aspose.BarCode

解决方案

软件定制解决方案: 软件系统定制高端UI定制业务系统定制

智能制造解决方案: OMES制造执行系统 APS生产排程系统 OQMS质检管理系统 OPTS生产溯源系统 OTPM设备管理系统 OKanban看板管理 DA工业数据采集系统 SRM供应商管理 PDM产品数据管理 WMS仓储管理 OMES ProLine产线MES系统

行业方案

制造行业: 磁性材料行业hot 汽车零配件行业电子行业精密装配行业钣金行业机械加工行业汽车改装行业金属薄膜材料行业灯具照明行业电线电缆行业钢结构行业

其他行业: 石油行业hot 医疗行业金融行业建筑行业

视频课程

产品视频: UI界面类图标报表网络通讯文档管理矢量图像处理位图图像处理音频视频文件格式转码条形码加密解密测试分析地图/CAD/GIS BI/大数据算法工作流 UML 数据库/服务器 IDE 项目管理思维导图其他移动开发扫描识别条形码

学院课程: VIP视频免费视频用户界面图表报表文档管理大数据工作流项目管理测试分析往期公开课项目管理其他

企业培训: 定制培训班

关于慧都

慧都简介慧都文化联系我们合作伙伴典型客户

彩票走势图 > 资讯 > Minitab小技巧：机器学习下的多元回归

Minitab小技巧：机器学习下的多元回归

转帖|使用教程|编辑：况鱼杰|2020-09-07 15:32:25.837|阅读 742 次

概述：多元回归是六西格玛管理中常用的一统计工具，它可以帮助考察多个x对y的影响，并建立可以用于预测的回归方程。而今天将基于Minitab 19向大家介绍机器学习下的多元回归。Minitab中已经引入很多机器学习的算法，在Minitab 19中还加入了CART分类树与CART回归树算法，但是今天的重点是多元回归。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接：

多元回归是六西格玛管理中常用的一统计工具，它可以帮助考察多个x对y的影响，并建立可以用于预测的回归方程。而今天将基于Minitab 19向大家介绍机器学习下的多元回归。Minitab中已经引入很多机器学习的算法，在Minitab 19中还加入了CART分类树与CART回归树算法，但是今天的重点是多元回归。

点击立即下载Minitab19

什么是好的模型？

在建模的时候最不愿意看到两种情况：过度拟合和欠拟合。使用与拟合模型相同的数据来评估模型，经常会导致过度拟合，如下图。

而这种过度拟合的模型如果用来预测的话，效果往往不好。

那么什么才算一个好的模型呢？一个好的模型需要在高方差（过度拟合）和高偏差（欠拟合）之间找到一种权衡。

上图就是由于模型太简单导致存在高的偏差。

上图就是由于模型过度拟合导致存在高的方差（为什么说高方差呢？大家试想一下挪动一点试试看）。

什么是“验证？

那么如何去找到“高偏差”与“高方差”之间的权衡呢？这就需要用到“验证”法了。

机器学习下的多元回归把数据分为两大类：训练集和测试集。训练集用来创建模型，而测试集来评估模型的性能。这样就可以来权衡过度拟合和欠拟合的模型。

从上图中我们可知，用训练集来建模时，模型越复杂模型误差越小，但再来看看测试集你会发现当模型复杂到一定程度，它的误差会随着模型复杂度的增加而增大。也就是说，太简单和太复杂的模型都不能很好的用来预测。这是如何做到的呢？这就要来说说机器学习中的“验证”法了。

在Minitab 19中的回归中，加入“验证”按钮，丰富了验证的方法。

验证法一共有三种：留一验证法、测试集验证法和K者交叉验证法，下面我们一起来看看三者之间的区别。

留一验证法

这种方法正如其名，留一留一，就是留下一行yi，再用其他所有数据来建模，得到模型后再把留下来这一行代入得到的模型就会得到对应的拟合者，其过程如下所示：

接下来，我们计算预测的残差平方和（Predicted Residual Sum of Squares）

有了PRESS就可以来计算R-sq(预测)了，到这里是不是很熟悉了。

测试集验证法

随机保留一定比例（Minitab 19默认保留30%）的数据（测试集），用剩余的数据来拟合模型（训练集）。

用测试集数据计算误差，基于测试集数据的误差统计汇总信息选择模型。

另外，此时的残差分析也有点不同。

K折交叉验证法

将数据拆分为K个子集或份，以其中一份为测试数据，其它K-1份用于训练数据来拟合模型。使用测试数据计算误差，重复k次，每次忽略一份，基于测试数据误差统计汇总信息选择模型。

总结

这三种验证方法，留一法比较实用于小样本，测试集验证和K折交叉验证比较实用于大样本（在Minitab 19的CART分类树和CART回归树中，当数据行数小于等于 5000 时，K 折交叉验证方法为默认方法）。另外，在Logistic回归中仅使用测试集验证法。

最后，如果您感兴趣，不妨再去试试Minitab 19中的逐步回归，您也会有新发现哦！

Minitab是做质量分析的工具，不知道您是否有产品质量这方面的困扰呢？不妨试试产品质量分析及预测方案吧！点击咨询在线客服

标签：

本站文章除注明转载外，均为本站原创或翻译。欢迎任何形式的转载，但请务必注明出处、不得修改原文相关链接，如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn

文章转载自：Minitab Users Group ，何茂林

上一篇：适用于MFC/Visual C++平台的界面开发工具Calendar日历插件示例合集下一篇：数据库监控器Navicat Monitor使用教程：如何诊断 MySQL 8的瓶颈和死锁

相关产品

Minitab Statistical Software

可视化、分析并挖掘数据价值的统计软件，帮助人们掌握数据的强大力量

最新文章 MORE

彩票走势图相关的文章 MORE

title

title

业务系统定制

智能制造解决方案: 工业设计运营管理生产管理

石油工程解决方案: 油气勘探数字化钻井工程数字化数据管理与分析

关于我们: 慧都简介公司动态业务区域典型案例

区域服务电话: 重庆 / 023-68661681 华东 / 13452821722 华南 / 18166486035 华北 / 17347785263

客户支持: 技术培训/ 咨询服务服务热线：400-700-1020 邮箱：sales@pclwef.cn 微信在线咨询

官方微信

官方微博

服务电话

重庆/ 023-68661681

华东/ 13452821722

华南/ 18100878085

华北/ 17347785263

客户支持

技术支持咨询服务

服务热线：400-700-1020

邮箱：sales@pclwef.cn

关注我们

地址 : 重庆市九龙坡区火炬大道69号6幢

慧都科技版权所有 Copyright 2003- 2024 渝公网安备 50010702500608号

扫码咨询

添加微信立即咨询

电话咨询

客服热线
023-68661681

TOP

<tfoot id='qb642'></tfoot>

<legend id='qb642'><style id='qb642'><dir id='qb642'><q id='qb642'></q></dir></style></legend>

<i id='qb642'><tr id='qb642'><dt id='qb642'><q id='qb642'><span id='qb642'><b id='qb642'><form id='qb642'><ins id='qb642'></ins><ul id='qb642'></ul><sub id='qb642'></sub></form><legend id='qb642'></legend><bdo id='qb642'><pre id='qb642'><center id='qb642'></center></pre></bdo></b><th id='qb642'></th></span></q></dt></tr></i><div id='qb642'><tfoot id='qb642'></tfoot><dl id='qb642'><fieldset id='qb642'></fieldset></dl></div>