讨论 2020-12-16

经典模型及算法导览（六）

监督学习，半监督，弱监督，无监督，强化学习

机器学习中有很多不同的场景，而其中比较常见的分类方法是根据数据标注情况来的：

监督学习：训练集中所有数据都带有人工标注
半监督：训练集中部分数据带有人工标注
弱监督：训练集中所有数据都带有人工标注，但标注内容与任务所需有差别，比如要求检测一张图片中的所有物体，但标注只标出了一个
无监督：训练集中所有数据都不带人工标注，由人设计的规则得到的标注不算人工标注
强化学习：强化学习所采用的的监督信号与上述都有差异，一般认为强化学习没有固定的训练集，而是不停与环境交互，得到反馈

监督学习

监督学习是最常用，但也是成本最高的，大部分机器学习都适用于监督学习的场景，也是最容易接近实际任务需求的。

半监督学习

半监督指的是有一部分标注数据，但同时也有一部分无标注数据，比如在翻译中，有中英对照的译文（标注数据）也有单纯的中文语料库（无标注数据）。又或者，需要从照片中识别物体，有一部分是有人工标注出哪些位置有什么物体的（标注数据），而另一部分是单纯的图像（无标注数据）。这些都属于典型的半监督学习。当然，还有一些更为的特殊的场景，比如二类分类问题中，只有正样本。也就是Positive Unlabel (PU) Learning，需要相应的算法来应对。

弱监督学习

弱监督，即指标注数据不是任务所需的，比如让找东西，结果标注只是在哪个附近。或者给质量打分（10分制），但标注是优良中差。简单来说，弱监督的特点是答非所问，但也有点联系。我个人认为，distant learning也属于这一范畴。

无监督学习

无监督，即没有人工标注，但不是没有标注，我们同样需要label和监督信号，只不过他不是人工提供的。所以“无监督”指的是“无人工监督”而不是没有监督。所以只要是不需借助人工就可以提供标注的方法都是无监督学习。像Auto encoder，Language model 都属于无监督学习，他们的label可以从数据本身推测得到，而不需任何人工参与。当然，无监督的界定也有模糊的时候，比如借助人工编写的规则，在网上自动爬取数据，算不算无监督？这其实不好说，大家标准不一样，主要看人工编写的规则是不是很复杂，是不是通用，包含了多少知识等。

强化学习

强化学习没有固定的训练集这一概念，他给了模型一个可以交互的环境，模型做任何事情都会从环境中获得相应的反馈，而这些反馈就是监督信号。交互与自由探索是强化学习的特色。 https://cs.stanford.edu/people/karpathy/convnetjs/demo/rldemo.html

半监督学习范式

半监督学习大部分都遵循几种范式

无标注数据上的预训练+有标注数据上的监督学习
无监督与有监督的多任务学习
有监督学习预热，再无监督学习

弱监督学习范式

弱监督学习范围很广，每种场景的处理方法都不同，这里指介绍两种常见的

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

2020-12-16.md

2020-12-16.md

讨论 2020-12-16

经典模型及算法导览（六）

监督学习，半监督，弱监督，无监督，强化学习

监督学习

半监督学习

弱监督学习

无监督学习

强化学习

半监督学习范式

弱监督学习范式

预告

Distant learning

PU learning

Learning with noise

Files

2020-12-16.md

Latest commit

History

2020-12-16.md

File metadata and controls

讨论 2020-12-16

经典模型及算法导览 （六）

监督学习，半监督，弱监督，无监督，强化学习

监督学习

半监督学习

弱监督学习

无监督学习

强化学习

半监督学习范式

弱监督学习范式

预告

Distant learning

PU learning

Learning with noise

经典模型及算法导览（六）