梯度提公升樹採用的是梯度下降法嗎？

1樓：雜言

是的，巨集觀來看是這樣的。GBDT的過程有點像神經網路的梯度下降到達最值，只要把神經網路的負梯度更新引數視為函式(基分類器)完成即可。

另外，我覺得其實名字很迷惑，我當時還覺得明明是梯度下降的思想，為什麼要用梯度提公升樹這個名字？我感覺梯度提公升樹，應該是指使用梯度的提公升樹，所以梯度提公升樹準確分割是"梯度|提公升樹"，而不是"梯度提公升|樹"，也就是和梯度上公升可能不是乙個概念(這個觀點只是個人理解，如果不對也請指出)。

而提公升樹中的提公升正是來自於其加法模型的思想。

2樓：圍兜哥哥

你這樣理解吧，如果損失函式是殘差（回歸），就是梯度下降，盡量的找殘差的極小值，如果損失函式是sigmod等（分類），就是梯度提公升，相反的，盡量的找概率的最大值。可以畫一下只有乙個或者兩個入參的損失函式曲線，一目了然。當然本質都一樣，通過求導找值。

3樓：ijnmklpo

個人感覺本質上還是梯度下降。每棵樹擬合梯度差不多可以看做是梯度下降時在引數空間中挪一步（一次迭代）。只是在樹的搜尋空間裡，沒法對目標函式直接進行梯度下降，所以只能這樣做。