神經網路模型壓縮好就業嗎

1樓：鳳舞九天

模型最終部署還得靠算力更強的顯示卡，以及不斷得增加顯示卡資料，模型壓縮就是圖一樂。

哈哈，上面開個玩笑。目前各個公司模型壓縮都會用到，包括開源的結構或者自己搞出來的結構，甚至nas。所以說方向沒什麼問題，還是看個人做到什麼程式。

c++大家都知道，多少年了，誰要是說真的精通c++，那真是無敵了。

2樓：鵬飛

目前我已經把BERT與知識蒸餾結合到一起，在具體的業務場景上蒸餾以後的6-8層bert和原版的12層bert效果基本持平，希望和量化技術結合到一起進一步加速，但是不知道該如何進行或者說缺乏乙個場景，請大佬們賜教？我已經在CV的分類任務做到了蒸餾和量化的結合。

3樓：

c9本科，top2碩士，目前在北京網際網路公司工作。碩士課題和模型壓縮緊密相關，可無奈當時找工作對口的組很少，我是2023年的秋招。可能目前博士畢業現在研究的人多了些吧。

4樓：圈圈蟲

我覺得CV方向不太好就業了，模型壓縮無非就三個大方向:剪枝，量化，稀疏。

剪枝:已經被NAS(Neural Architecture Search)取代，現在不是2017的時候，需要壓縮vgg16這種巨無霸網路了，只要有資料從頭訓練乙個小網路更容易。

量化:Int8是及格線，現在開源框架基本上都支援Int8推理，速度的天花板與硬體有關，也在不斷逼近，更多的是優化工程實現。至於精度，Quantization Aware Training的原理就那幾點，後面也是工程實現。

現在等待的就是突然開源一種簡單，高效，可靠的量化大禮包工具一統江湖，結束戰爭。Int4在工業界大概率被跳過而直接上馬二值網路，然而開源框架也有了dabnn。

稀疏:都是唬人的，通用處理器跑起來又沒有加速效果，有何用？

除非你有非常棒的case能推動工業界前進那麼一點點的能力，否則建議不要涉足這個方向。

更新一下，可以嘗試在NLP，3D視覺開拓新領域。總之，當你發現大家都開始做一件事情時，紅海就開始了。