[吴恩达 机器学习]第十一章 应用机器学习的建议

本文探讨了机器学习中模型选择、训练与验证的过程,包括如何通过交叉验证集避免过拟合,诊断偏差与方差问题,以及如何利用学习曲线指导后续工作。介绍了正则化对偏差与方差的影响,并提供了基于复杂神经网络与正则化调整的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

83 决定下一步做什么

做之前了解这样做是否有效(筛除无效的选项)
预测房价
Machine learning diagnostic
在这里插入图片描述

84评估假设(训练集 测试集)

取数据前最好打乱一下
在这里插入图片描述
在这里插入图片描述

85 模型选择和训练、验证

模型选择问题:

  • 数据集最合适的多项式次数
  • 如何选用正确的特征
  • 选择算法中的正则化参数lambda
    只有测试集无法考察泛化能力
    根据测试集的表现选择了模型(相当于测试集参与训练了),再用测试集去试验泛化能力就会不准确(偏高)!
    在这里插入图片描述
    cross validation set(cv)验证集
    在这里插入图片描述
    三种
    在这里插入图片描述
    测试集验证泛化能力在这里插入图片描述

86诊断偏差和方差

在这里插入图片描述
在这里插入图片描述

87 正则化和偏差、方差

问题:

  • 正则化是如何影响方差的
    在这里插入图片描述
    三个误差计算不考虑正则化
    在这里插入图片描述

在这里插入图片描述

lambda小的时候过拟合所以Jcv就很大(Jcv;左边是方差 过拟合,右边是偏差 欠拟合)
交叉误差最小的点选出lambda
在这里插入图片描述

89 学习曲线

在这里插入图片描述
高偏差(欠拟合)
交叉验证误差和训练误差都很高,增加训练数据并不能优化模型在这里插入图片描述
高方差(过拟合)
交叉验证误差和训练误差相差较大,数据增多有帮助
在这里插入图片描述

训练时多画这些曲线

决定接下来做什么

问题

  • 弄清哪些方法有助于改善算法,哪些又是徒劳
    高偏差(欠拟合):选的模型太简单,正则化严重
    高方差(过拟合):选的模型太复杂或者训练数据不够,正则化不够
    在这里插入图片描述
    通常使用一个复杂神经网络并用正则化方法修正更好
    隐藏层选择:选一个两个三个试试对比一下
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值