boosting演算法中，除了adaboost以外，為什麼都要進行殘差的擬合？擬合真實值不香嗎？

首頁 > 社會

時間 2021-12-20 10:05:34

1樓：艾斯威.艾姆

我是這樣理解的：

在boosting的過程中，模型每次擬合錯誤的樣本是越來越難的。最初單個模型學習樣本，會把容易的做對，留下一些困難的樣本，然後模型專注於學習這些困難的樣本，最後把這些模型結合在一起。和我們大部分人學習一樣，先學簡單的再學難的能學得更好。

這樣的好處是，一般而言簡單的樣本更能體現資料的本質，所以一開始學習簡單的樣本不至於讓模型陷入區域性最優，更容易到達全域性最優的附近，防止了過擬合；到達最優值附近之後再用難的樣本去調優模型。

boosting的思路實際上和深度學習的curriculum learning（課程學習）是一致的。在深度學習裡困難的樣本對應的梯度更大，對應的loss函式更加不光滑，所以更難優化。用簡單的樣本構成的loss先讓模型下降到最優值附近，然後用難的樣本調優，就是這個道理。

殘差網路效果好我估計也有這個原因在裡面。前面的網路學習乙個大致的loss函式，更加深層的網路學習細微的loss變化，防止了過擬合

演算法導論中，Strassen s的演算法的問題。

AutherM 簡單地解釋應該是用order of growth為的計算來取代一部分 growth為使得recurrence 從變為了從而使得recurrence 的解由變為我看上述答案都沒答在點子上。嘗試答一答，如有錯陋請指出。strassen演算法的關鍵不在於是乘法還是加法，而是在於...

Tabular Q learning演算法中的學習率有沒有意義

A1錄用來乙個好嗎 Note that the step size paramether StepSize used in the incremental method described above 原文裡是乙個update formula changes from time step to ti...

除了王思聰，誰才是 LPL 最菜的 AD？

泡芙芙反對最後的輕語回答小孩遊神kid是最菜ad為了黑而黑根本沒有意義。先說幾個大資料。lpl目前為止勝率最高的vn是kid。目前vn在比賽上單場輸出最高的選手也是kid.雖然最低也是他。lpl總擊殺第七。這是目前資料。在役時總擊殺最高到過第二。比他高的僅有uzi。lpl第三個千殺先生。前兩個分別...

其他用戶還看了：