機器學習領域回歸和分類問題能否互相轉化？

1樓：鬼蕨

回歸和分類問題是可以相互轉化的，理由如下：

首先，回歸問題和分類問題本質上都是要讓機器學習的模型擬合乙個目標函式。

對於回歸問題而言，這個目標函式是，其中和是輸入和輸出的維數。

對於分類問題而言，這個目標函式是，其中是輸入的維數，是分類標籤的集合。

但是它也是乙個集合呀！

因此我們可以將回歸問題轉化成分類問題：設乙個誤差精度，將分割成若干個邊長為的單位正方形/正方體/超立方體區域，如果函式值落入這個區域內則視為屬於這個類別，這樣就將回歸問題轉化成了分類問題。（當然，處於邊界處的元素難免落入錯誤的分類，因此loss看起來會不那麼漂亮。

）同樣地，我們也可以將分類問題轉化成回歸問題：設有個分類，對於每乙個輸入，我們可以給出它分別屬於每乙個分類的概率（或者可信度、歸屬度）。快看，這些概率可全都是實數值呀！

那整個目標函式的值域就是了！這樣就將分類問題轉化成了回歸問題。

所以這豈止是可以互相轉化，可以毫不誇張地說，這兩類問題它就是等價的！誒嘿！

2樓：Jack Stark

這取決於類與類之間的關係。

如果類別之間有遞增的關係，比如體重的「較輕」、「合適」、「超重」，「較輕」和「超重」之間的類間差距大於「較輕」和「合適」之間的類間差距。這種問題最好用回歸的方法，因為使用分類的話對類別的onehot編碼體現不出這種類間差距的區別。

如果類別之間是對稱關係，如「蘋果」、「香蕉」和「士多啤梨」，我們認為它們任意兩類之間的差距應該相同，此時如果用回歸的方法就違背了這個先驗知識（因為用三個實數來表示它們沒法保證兩兩差距相等），所以最好對類別使用onehot編碼當成分類來做。