大家對強化學習和組合優化或機器學習和組合優化的未來發展持樂觀還是悲觀態度呢，有什麼想法和建議嘛？

1樓：

實話實說，前景不太樂觀。理論分析上沒有大的突破，計算上小打小鬧。雖然在AI的帶動下很熱鬧，但是水文章太多了，能持續多久呢？

2樓：公孫金童

大多數組合優化問題的演算法，混合方法比不上傳統OR的方法。

機器學習和精確演算法想結合：利用機器學習的方法進行剪枝；（了解不多）機器學習和啟發式演算法結合：操作選擇使用一些機器學習的方法，如使用multi-arm bandis選擇不同的鄰域和交叉算符；使用機器學習的方法進行挖掘優質解的特點，並進行重新構造（如山東大學有一篇使用q-learning結合蟻群演算法解決TSP問題）；還有想google brain和日本的一些研究所那樣，利用GPU計算結合模擬特卡羅搜尋樹來進行搜尋；

我在這方面做了不少的探索，對當前的機器學習和組合優化結合持悲觀態度。很多NP-hard問題可能在某些算例裡的小範圍內存在某種可以歸納的規律，但就一般算例和搜尋空間來看，可能真的是一片混沌。

還需要更加深刻和精準的理論來定量分析才能迎來更好的發展。

大家對強化學習和組合優化或機器學習和組合優化的未來發展持樂觀還是悲觀態度呢，有什麼想法和建議嘛？

強化學習比傳統的優化決策演算法優勢在什麼地方？

深度學習和強化學習之間的差別有多大？

強化學習中q learning和MDP的區別是什麼？

其他用戶還看了：