Skip to content

Latest commit

 

History

History
48 lines (36 loc) · 3.44 KB

2020-12-16.md

File metadata and controls

48 lines (36 loc) · 3.44 KB

讨论 2020-12-16

经典模型及算法导览 (六)

监督学习,半监督,弱监督,无监督,强化学习

机器学习中有很多不同的场景,而其中比较常见的分类方法是根据数据标注情况来的:

  • 监督学习:训练集中所有数据都带有人工标注
  • 半监督:训练集中部分数据带有人工标注
  • 弱监督:训练集中所有数据都带有人工标注,但标注内容与任务所需有差别,比如要求检测一张图片中的所有物体,但标注只标出了一个
  • 无监督:训练集中所有数据都不带人工标注,由人设计的规则得到的标注不算人工标注
  • 强化学习:强化学习所采用的的监督信号与上述都有差异,一般认为强化学习没有固定的训练集,而是不停与环境交互,得到反馈

监督学习

监督学习是最常用,但也是成本最高的,大部分机器学习都适用于监督学习的场景,也是最容易接近实际任务需求的。

半监督学习

半监督指的是有一部分标注数据,但同时也有一部分无标注数据,比如在翻译中,有中英对照的译文(标注数据)也有单纯的中文语料库(无标注数据)。又或者,需要从照片中识别物体,有一部分是有人工标注出哪些位置有什么物体的(标注数据),而另一部分是单纯的图像(无标注数据)。这些都属于典型的半监督学习。 当然,还有一些更为的特殊的场景,比如二类分类问题中,只有正样本。也就是Positive Unlabel (PU) Learning,需要相应的算法来应对。

弱监督学习

弱监督,即指标注数据不是任务所需的,比如让找东西,结果标注只是在哪个附近。或者给质量打分(10分制),但标注是优良中差。简单来说,弱监督的特点是答非所问,但也有点联系。我个人认为,distant learning也属于这一范畴。

无监督学习

无监督,即没有人工标注,但不是没有标注,我们同样需要label和监督信号,只不过他不是人工提供的。所以“无监督”指的是“无人工监督”而不是没有监督。所以只要是不需借助人工就可以提供标注的方法都是无监督学习。像Auto encoder,Language model 都属于无监督学习,他们的label可以从数据本身推测得到,而不需任何人工参与。当然,无监督的界定也有模糊的时候,比如借助人工编写的规则,在网上自动爬取数据,算不算无监督?这其实不好说,大家标准不一样,主要看人工编写的规则是不是很复杂,是不是通用,包含了多少知识等。

强化学习

强化学习没有固定的训练集这一概念,他给了模型一个可以交互的环境,模型做任何事情都会从环境中获得相应的反馈,而这些反馈就是监督信号。交互与自由探索是强化学习的特色。 https://cs.stanford.edu/people/karpathy/convnetjs/demo/rldemo.html

半监督学习范式

半监督学习大部分都遵循几种范式

  • 无标注数据上的预训练+有标注数据上的监督学习
  • 无监督与有监督的多任务学习
  • 有监督学习预热,再无监督学习

弱监督学习范式

弱监督学习范围很广,每种场景的处理方法都不同,这里指介绍两种常见的

  • 标注不完整
  • 标注粒度不对
  • 标注有噪声

预告

Distant learning

PU learning

Learning with noise