在DL中為什麼將資料集分為訓練集開發集測試集可以提高迭代效率

1樓：塞罕寶貝

在 deep learning 中我們通常追求的是最高效的求得收斂的最優解，在學術界可以通過提高模型複雜度，增加資料學習資料集規模，增加特徵工程複雜度等方法得到更廣泛意義的最優解。

但是在工業界，公司追求的是roi投資回報率最大，那麼就要在最短學習時間，學習成本的前提下盡可能找到區域性最優解去近似全域性最優解。

所以這就可以要用到您所說的交叉驗證。將資料集分成多份，訓練集，測試集一般我們把乙份資料分成無份，然後在訓練乙個模型的時候並行的使用這五份資料集交叉使用學習集和測試集，這樣通過多次實驗，可以快速的得到近似區域性最優解。提高模型的學習效率，降低訓練的時間成本和經濟代價。

2樓：林凌

和效率啥的沒什麼關係，主要就是為了提供乙個相對準確的效能評價。

因為深度神經網路的強大擬合能力，模型在訓練集上的正確率多半不會低於99%沒啥參考價值，因此要根據模型在沒見過的新資料上的表現評價其效能，這就有了測試集

而根據相同的原因，模型的超引數調整同樣需要不同於訓練集的一組資料，而如果直接用測試集，那還是相當於間接地使用測試集進行了訓練，也不合適。所以就有了驗證集

3樓：iwuqing

如果沒有開發集，你就沒辦法進行超引數調優了。

假定我們現在只有訓練集和測試集，模型本身有乙個超引數a，我們知道超引數是你在訓練之前就預設的，而不是你的訓練得到的。也就是說我們在訓練之前只能憑經驗（隨便）給a設定乙個值，然後開始訓練模型。這時候你就開始使用測試集測定模型的泛化誤差。

很多人這裡出現乙個誤區：根據模型在測試集上的表現反過來調節超引數a，然而這是不行的。因為測試集是只能用來測量泛化誤差，你不能用這個泛化誤差去調你的模型。

這時候就輪到開發集上場了，訓練集訓練模型，開發集衡量訓練效果的同時進行超引數調優，測試集測定泛化誤差。

在DL中為什麼將資料集分為訓練集 開發集 測試集可以提高迭代效率