《机器学习》第1章·通俗解读 | 机器学习到底是什么用最接地气的方式带你搞懂“西瓜书”第一章1. 一句话说清机器学习是干啥的机器学习 ≈ 让电脑从经验中学习自己变聪明你小时候吃过很多西瓜慢慢就知道 颜色青绿、根蒂蜷缩、敲起来声音“砰砰”响 → 大概率是好瓜这就是“经验”帮你做了判断。机器学习就是把这种过程搬到电脑上给电脑一堆数据让它自己找出规律下次遇到新问题也能判断。2. 几个必须懂的词用西瓜举例术语人话解释例子样本一条数据一个西瓜的记录特征 / 属性这个瓜的各方面信息色泽、根蒂、敲声标记最终答案是不是好瓜训练让电脑学习给电脑看100个瓜的特征答案模型学出来的规律“青绿蜷缩浊响 → 好瓜”预测用模型判断新瓜看到一个没切开的瓜猜它好不好一句话训练 做练习题模型 学会的解题方法预测 做新题3. 监督学习 vs 无监督学习划重点电脑学习的时候给不给“答案”区别巨大。监督学习数据既有特征也有标记答案就像你做选择题做了之后对答案知道自己对错。电脑慢慢就知道哪些特征组合 → 哪个答案。例子判断好瓜答案已知、识别猫狗图片图片上有“猫”或“狗”标签无监督学习数据只有特征没有标记答案就像给你一堆水果但不告诉你名字你自己把它们按颜色、大小分成几堆。电脑只能自己发现数据里的“结构”或“组”。例子把西瓜分成几类可能一类是“皮薄个大的”一类是“皮厚个小的”但到底每类叫什么电脑不知道要你来起名。一句话有答案 → 监督学习没答案 → 无监督学习4. 假设空间电脑在“猜”什么电脑学习的过程就像在黑盒子里猜公式。比如判断好瓜它可能猜好瓜 色泽青绿 AND 根蒂蜷缩 AND 敲声浊响也可能猜好瓜 只要根蒂蜷缩颜色随便所有可能的猜法放在一起就叫假设空间。电脑的任务从这些可能性里找出最对的那个。5. 归纳偏好电脑也有“性格”有时候好几条规则都能解释训练数据。那电脑选哪条 这就看它的“偏好”——喜欢简单的还是喜欢复杂的。奥卡姆剃刀原理越简单的解释越可能是对的就像你猜别人心思一般不会往特别离谱的方向想6. 没有万能算法NFL定理一个很反直觉的结论没有任何一种算法在所有问题上都比别人强。 所以别再问“哪个算法最好”要问“哪个算法最适合我的问题”就像你问“什么车最好”拉货选皮卡带家人选SUV没人会说F1赛车最好。7. 机器学习发展史三起三落50–70年代逻辑推理为主像机器人下棋80年代决策树开始流行90年代支持向量机SVM称王2010年后深度学习爆发大数据强算力深度学习不是凭空冒出来的是“神经网络”这个老方法等来了好时代。8. 机器学习现在用在哪儿百度/谷歌搜索你打字它就猜到你想搜啥抖音/B站推荐越刷越懂你自动驾驶让车自己看路、自己刹车医疗影像帮医生看CT片子奥巴马竞选用模型分析选民决定去哪里拉票机器学习已经不是你“要不要学”的问题而是你“什么时候学”的问题。 第一章总结背下这5句就够了机器学习 让电脑从数据里学规律数据有特征、有标记 → 监督学习没有标记 → 无监督学习假设空间 所有可能的规律归纳偏好 电脑的选择倾向通常喜欢简单没有万能算法适合自己的才是最好的 下章预告模型到底好不好怎么比较怎么防止它“死记硬背”下一章带你搞懂训练集、测试集、过拟合、交叉验证从零啃透机器学习用“挑西瓜”讲透机器学习第二章-CSDN博客本专栏持续更新中收藏关注不迷路~
从零啃透机器学习:用“挑西瓜”讲透机器学习第一章
《机器学习》第1章·通俗解读 | 机器学习到底是什么用最接地气的方式带你搞懂“西瓜书”第一章1. 一句话说清机器学习是干啥的机器学习 ≈ 让电脑从经验中学习自己变聪明你小时候吃过很多西瓜慢慢就知道 颜色青绿、根蒂蜷缩、敲起来声音“砰砰”响 → 大概率是好瓜这就是“经验”帮你做了判断。机器学习就是把这种过程搬到电脑上给电脑一堆数据让它自己找出规律下次遇到新问题也能判断。2. 几个必须懂的词用西瓜举例术语人话解释例子样本一条数据一个西瓜的记录特征 / 属性这个瓜的各方面信息色泽、根蒂、敲声标记最终答案是不是好瓜训练让电脑学习给电脑看100个瓜的特征答案模型学出来的规律“青绿蜷缩浊响 → 好瓜”预测用模型判断新瓜看到一个没切开的瓜猜它好不好一句话训练 做练习题模型 学会的解题方法预测 做新题3. 监督学习 vs 无监督学习划重点电脑学习的时候给不给“答案”区别巨大。监督学习数据既有特征也有标记答案就像你做选择题做了之后对答案知道自己对错。电脑慢慢就知道哪些特征组合 → 哪个答案。例子判断好瓜答案已知、识别猫狗图片图片上有“猫”或“狗”标签无监督学习数据只有特征没有标记答案就像给你一堆水果但不告诉你名字你自己把它们按颜色、大小分成几堆。电脑只能自己发现数据里的“结构”或“组”。例子把西瓜分成几类可能一类是“皮薄个大的”一类是“皮厚个小的”但到底每类叫什么电脑不知道要你来起名。一句话有答案 → 监督学习没答案 → 无监督学习4. 假设空间电脑在“猜”什么电脑学习的过程就像在黑盒子里猜公式。比如判断好瓜它可能猜好瓜 色泽青绿 AND 根蒂蜷缩 AND 敲声浊响也可能猜好瓜 只要根蒂蜷缩颜色随便所有可能的猜法放在一起就叫假设空间。电脑的任务从这些可能性里找出最对的那个。5. 归纳偏好电脑也有“性格”有时候好几条规则都能解释训练数据。那电脑选哪条 这就看它的“偏好”——喜欢简单的还是喜欢复杂的。奥卡姆剃刀原理越简单的解释越可能是对的就像你猜别人心思一般不会往特别离谱的方向想6. 没有万能算法NFL定理一个很反直觉的结论没有任何一种算法在所有问题上都比别人强。 所以别再问“哪个算法最好”要问“哪个算法最适合我的问题”就像你问“什么车最好”拉货选皮卡带家人选SUV没人会说F1赛车最好。7. 机器学习发展史三起三落50–70年代逻辑推理为主像机器人下棋80年代决策树开始流行90年代支持向量机SVM称王2010年后深度学习爆发大数据强算力深度学习不是凭空冒出来的是“神经网络”这个老方法等来了好时代。8. 机器学习现在用在哪儿百度/谷歌搜索你打字它就猜到你想搜啥抖音/B站推荐越刷越懂你自动驾驶让车自己看路、自己刹车医疗影像帮医生看CT片子奥巴马竞选用模型分析选民决定去哪里拉票机器学习已经不是你“要不要学”的问题而是你“什么时候学”的问题。 第一章总结背下这5句就够了机器学习 让电脑从数据里学规律数据有特征、有标记 → 监督学习没有标记 → 无监督学习假设空间 所有可能的规律归纳偏好 电脑的选择倾向通常喜欢简单没有万能算法适合自己的才是最好的 下章预告模型到底好不好怎么比较怎么防止它“死记硬背”下一章带你搞懂训练集、测试集、过拟合、交叉验证从零啃透机器学习用“挑西瓜”讲透机器学习第二章-CSDN博客本专栏持续更新中收藏关注不迷路~