监督学习
引入¶
这一节,我想通过一个例子来介绍什么是监督学习(Supervised Learning)1,我尽量能够以一种通俗易懂的方式来告诉你 What is it ?
当然,我们首先也得先看看官方是如何定义监督学习的:
监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。
是不是觉得巴拉巴拉的,其实这些都是不重要的!其实监督学习的机制和你小时候学习认字其实是一样的,告诉你这个什么字,你反复看到几次就知道这个字了。相似的, 监督学习,就是你在训练(到这里你可能还不了解什么是训练数据,你可以理解为你记单词的时候反复去看这个单词)数据的时候,给他一个参照物(label),让他从而学到一定的知识。
举例¶
Andrew 教授举了这样一个例子:
一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来,看起来是这个样子:横轴表示房子的面积,单位是平方英尺,纵轴表示房价,单位是千美元。那基于这组数据,假如你有一个朋友,他有一套750平方英尺房子,现在他希望把房子卖掉,他想知道这房子能卖多少钱。
关于这个问题,其实这是一个回归问题(Regression)2,你认为机器学习算法是要怎样工作呢
在学习算法中,我们目标是找到一条线能够尽可能地去拟合所有的数据,拟合的方式有很多,图中有线性拟合和二次拟合,很显然二次拟合的方式是比较好的。但是这里怎么去拟合呢?其实我们这里就是用到了监督学习,需要给每个数据一个正确的标签,这些标签你可以把它们看成正确答案。在每次让机器学习的时候,都是通过正确的数据去矫正学习参数(这里我不准备介绍其中的工作原理,后面会单独讨论),通过不停的矫正,最终可以得到一个比较好的拟合曲线。其实这里就是让机器学到了一个比较好的结果。
回头想一想,你是不是觉得这样的过程(监督学习)和你记单词的时候是一样的啊~
参考链接和资料¶
本页面的全部内容在 CC BY-SA 4.0 协议之条款下提供。