深度學習模型有哪些優秀的組合應用？

1樓：星辰大海

殘差網路 + Squeeze-and-Excitation Network (SENet) + 軟閾值化 =深度殘差收縮網路。

首先，殘差網路（又稱深度殘差網路、深度殘差學習）是一種卷積神經網路。相較於普通的卷積神經網路，殘差網路採用了跨層恒等路徑，以減輕卷積神經網路的訓練難度。殘差網路的一種基本模組如圖所示：

殘差網路

然後，Squeeze-and-Excitation Network是一種非常經典的注意力機制下的深度學習方法。它可以通過乙個小型的子網路，自動學習得到一組權重，對特徵圖的各個通道進行加權。其含義在於，某些特徵通道是比較重要的，而另一些特徵通道是資訊冗餘的；那麼，我們就可以通過這種方式增強有用特徵通道、削弱冗餘特徵通道。

Squeeze-and-Excitation Network的一種基本模組如下圖所示：

Squeeze-and-Excitation Network

第三，軟閾值化是許多訊號降噪方法的核心步驟。它的用處是將絕對值低於某個閾值的特徵置為零，將其他的特徵也朝著零進行調整，也就是「收縮」。在這裡，閾值是乙個需要預先設定的引數，其取值大小對於降噪的結果有著直接的影響。

軟閾值化的輸入與輸出之間的關係如下圖所示：

軟閾值化

最後，深度殘差收縮網路的結構如下圖所示：

綜上，在軟閾值化的作用下，深度殘差收縮網路更適合強雜訊資料的特徵學習。同時，其閾值是借助Squeeze-and-Excitation Network自動設定的，不需要人工進行設定。

10分鐘看懂深度殘差收縮網路 - 翼下之峰 - 部落格園

2樓：curry

說乙個我自己了解的吧 ICLR2020的一篇融合了MixMatch GMM和傳統的神經網路，搭建兩個對等網路來處理雜訊標籤問題，效果挺好，應該算不上很優秀的，只是我覺得這個想法值得我自己做的方向借鑑～還有就是谷歌17年的工作了，MentorNet網路，也是做雜訊標籤的，借鑑課程學習的思想，融合了LSTM CNN等來訓練兩個子網路模組

深度學習模型有哪些優秀的組合應用？

深度學習的模型加速與模型裁剪方法

深度學習的模型並行是什麼原理？

訓練好的深度學習模型是怎麼部署的？

其他用戶還看了：