2014年6月22日 星期日

A Survey on Transfer Learning


A Survey on Transfer Learning

Pan, Sinno Jialin, and Qiang Yang. "A survey on transfer learning." Knowledge and Data Engineering, IEEE Transactions on 22.10 (2010): 1345-1359.

傳統的機器學習通常只在測試數據以及訓練數據來自同樣的特徵空間(feature space)、以及同樣的機率分布下,會有良好的表現。但是在現實生活物中,這樣的假設並不一定總是正確的,而重新在不同的機率分布下蒐集資料是很昂貴的。因此transfer learning便是試圖要解決這一類的問題。














從上圖中,我們可以看出傳統的機器學習,以及transfer learning有何不同。
如圖右所示,transfer learning試圖利用在source tasks中學到的知識,加以解決Target task。

下面我們會稍微解釋一下問題的定義

1. Domain : 包含了兩個部分 : feature space( χ )以及probability distribution(  P(X) ),
    其中 X = {x1,x2,x3....} χ
綜合兩點,我們可以將domain D表示成 D = { χ ,P(X) }
 
2.Task : 也包含了兩個部分 : label space(Y) 以及 objective predictive function ( f(.) )
我們也可以將 Task 表示成T = {Y,f(.) }




transfer learningk的使用情境便是在source 以及 target 在domain 或者是task有任一或者兩者皆不同的情況下。而隨著情況不同,我們也對該情形下的transfer learning有著不同的稱呼,如下圖所示


 
而另外一方面,隨著source 以及 target的標記與否,我們又有另外一種表示方式如下














結合以上兩張表格,我們可以得到一個更詳細的統整如下







沒有留言:

張貼留言