迁移学习(零)--迁移学习基础

迁移学习在很多场景获得越来越多的应用。例如在图像识别中,例如同一个实体在不同的光照条件写拍摄的照片,模型识别的性能会下降,从而需要我们从一个场景迁移到另一个场景的情况。例如在医疗领域,一些罕见病的天然样本就是短缺的,那么如果利用现有的数据学习到这些新的知识呢?这些都是迁移学习需要解决的问题。以下的场景也同样有迁移学习的身影出没。

  1. 数据量小
  2. 机器学习需要鲁棒性
  3. 个性化定制问题
  4. 用户隐私数据安全

定义

给定源域`D_{s}`和学习任务`T_{s}`,目标域`D_{t}`和学习任务`T_{t}`,迁移学习的目的是获取源域和源学习任务帮助提升目标域中的模型预测函数。其中迁移学习主要分为同构迁移学习和异构迁移学习。

image.png

同构迁移学习

给定源域和源学习任务,同构迁移学习的目标是获取给定源域和源学习任务的知识提升目标预测函数f。其中源任务和目标任务数据无交集,但是标签一致。

异构迁移学习

给定源域和源学习任务,异构迁移学习的目标是获取给定源域和源学习任务的知识提升目标预测函数f。其中其中源任务和目标任务数据无交集,但是标签不一致。

从目标的角度看迁移学习分为监督迁移学习、半监督迁移学习、无监督迁移学习。
一个比较重要的问题是具体的迁移到底指哪个方面的迁移呢?

  1. 基于样本的迁移算法,迁移的知识对应于源样本的权重
  2. 基于特征的迁移,迁移的知识对应于源域和目标域的共享子空间
  3. 基于模型的算法,迁移的知识嵌入源模型的一部分
  4. 基于关系的迁移,迁移的知识对应于源域中实体之间的规则。

迁移学习与其他学习方式的关系

以下两张图分别说明了迁移学习与其他学习方式的一个关系。
image.png

image.png

迁移学习的核心目标还是想从原有的学习中获取知识并快速应用到其他的业务问题中,从第一张图中能够看出来,我们面临的大部分问题都是有标签有样本的问题,没有样本就想办法标注样本的阶段,迁移学习为我们提供了另一个思路去解决目前的困境。

升华一下

这里咱们再来总结一下迁移学习发生的必要条件到底什么呢? 其核心点是找到相似的点,然后通过度量的方式能把源域的特征或者空间转换到目标域的过程。除了相似点以外就是度量方式,如何看待两个物体是否相似呢?不同的视角看同一个苹果也可能相差很大。
再举一个生动的小例子,例如,在国内开车需要右侧靠马路行驶,但是到了英国就变成了左侧靠马路行驶,如果你想迁移这两种场景,就要找出最相似的点,就是靠马路行驶的,然后再做学习。 为什么是靠马路行驶是形式点呢,因为我两句话中都提到了这一点。但是如果更加隐晦的相似就不能直接使用啦,那么找到隐晦的相似点就是需要一个度量方式。接下来的内容里也会讲到度量方式的问题。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×