為什麼pytorch中的交叉熵損失用的是ylogp而不是ylogp 1 y log 1 p ？

1樓：Honda

交叉熵反映的是兩個概率分布的近似程度，其中式子裡面的y是實際分布，如果是二分類的話，它的取值只有0和1，所以當y=1的時候，後面那項就消掉了，當y=0的時候，前面那項消掉了，後面那項變成ylogp..因此可以直接這樣寫..

2樓：Shawvin

ylogp需要y是獨熱編碼，比如分成三類就是[0,0,1], [0,1,0]和[1,0,0], 而不能是0,1,2。並且可以用在多分類上。ylogp+(1-y)log(1-p)是binary cross entroy，是前者在二分類上形式，在這裡y也只能是0或者1，不能用獨熱編碼。

3樓：Github屆的卡卡西

ylog(p)+(1-y)log(1-p)，這個是二分類的交叉熵完整寫法。二分類時，隨意輸入乙個樣本，y只能取0或者1，計算loss的時候，加號兩邊總有乙個是0；這個跟ylog(p)是一樣的。ylog(p)是統一的寫法，既可以用作二分類的交叉熵，也可以用作多分類的交叉熵。

4樓：TY Sun

第乙個是softmax使用n個出口表示n分類，注意還要求和。

第二個是sigmoid使用1個出口表示2分類，可以認為是求和後的形式。