能否解釋一下dummy encoding和one hot encoding的具體使用和對自由度的影響？

1樓：李大貓

> library(CatEncoders)

>> X1 <- matrix(c(0, 1, 0, 1, 0, 1, 2, 0, 3, 0, 1, 2),c(4,3),byrow=FALSE)

> print(X1)

[,1] [,2] [,3]

[1,] 0 0 3

[2,] 1 1 0

[3,] 0 2 1

[4,] 1 0 2

> oenc <- OneHotEncoder.fit(X1)

> z <- transform(oenc,X1,sparse=FALSE)

> # return a dense matrix

> print(z)

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]

[1,] 1 0 1 0 0 0 0 0 1

[2,] 0 1 0 1 0 1 0 0 0

[3,] 1 0 0 0 1 0 1 0 0

[4,] 0 1 1 0 0 0 0 1 0

2樓：wjhbb

考慮乙個極端情況，最簡單的，單個連續變數的線性回歸，。

這裡 x 雖然是連續變數，但也不能阻止我們故意用 one-hot encoding 來表示它。比如，假設輸入資料 x 一共包含 n 個數，那可以把這 n 個數表達為 n x n 的單位矩陣。這樣的話，顯然可以直接精確擬合輸入的 y，也就是過擬合了。

本來只有 a 和 b 兩個引數，現在變成了 n 或 n+1 個引數。自由度的增多伴隨著的是引數的增多，所以更容易過擬合。

繼續這個假想的例子，為了減少過擬合，我們可以減少 one-hot encoding 的自由度個數，換言之，我們不用 n * n 矩陣，而用較小的矩陣；這樣就會導致不同的 x 的值對應相同的編碼。這樣做實際上是在用分段常數函式來擬合。

還是這個例子，我們也可以故意忘記輸入資料 x 的真實值，而把它們排序後用 1 到 n 的序號來代替，然後試圖擬合這些序號與 y 之間的關係。這相當於對 x 做了乙個奇怪的單調的非線性變換。但我們可以預期，雖然這麼做會讓本來的 x 與 y 的線性關係變成一種很彆扭的關係，但一般不至於導致過擬合。

3樓：王贇 Maigo

如果你不使用regularization，那麼one-hot encoding的模型會有多餘的自由度。這個自由度體現在你可以把某乙個分型別變數各個值對應的權重都增加某一數值，同時把另乙個分型別變數各個值對應的權重都減小某一數值，而模型不變。在dummy encoding中，這些多餘的自由度都被統攝到intercept裡去了。

這麼看來，dummy encoding更好一些。

如果你使用regularization，那麼regularization就能夠處理這些多餘的自由度。此時，我覺得用one-hot encoding更好，因為每個分型別變數的各個值的地位就是對等的了。

能否解釋一下dummy encoding和one hot encoding的具體使用和對自由度的影響？

能否通俗易懂的解釋一下和弦？

能否解釋一下王國風雲2的繼承機制？

能否通俗易懂，深入淺出地解釋一下linux中的掛載的概念？

其他用戶還看了：