強化學習在機械人領域都有哪些成功的例子？

1樓：

這個時候就要祭出綜述了

劉浚嘉：【重磅綜述】如何在少量嘗試下學習機械人強化學習控制

對於強化學習在機械人上的應用，有以下幾點方針：

需要找到傳統控制方法難以實現的點，比如非線性時變系統、high-level的複雜決策；

需要概率化建模（可關注專欄的 PR/Probabilistic in Robotics 系列文章）；

需要model-based來提高資料利用率（可關注專欄的 Model-based 系列文章）；

需要先驗地恰當引入（可關注專欄的 Imitation Learning 以及RLfD 系列文章）

SOTA的機械人強化學習演算法有：

PILCO

Black-DROPS

IT&E

MF-ES

Black-DROPS with GP-MI and VGMI

Sim-To-Real methods

應用場景涵蓋雙足、四足、六足，AGV，串聯機械臂抓取、插孔等，均是部署在real-world機械人上。

RL in Robotics

專欄目錄

劉浚嘉：Reinforcement-Learning-in-Robotics 專欄目錄

機器學習深度學習以及強化學習在金融領域有哪些應用？

GorgeousShar 據我所知，兩年前就有人做量化投資方面的交易了，但是收益嘛。因為資料一般是波段操作，這就導致了目前需要進行一些監督，並且演算法有限，現在還有些距離，個人期待AutoML能夠解決這個問題 gutu Granth 瀉藥,反洗錢反欺詐領域有很大的運用,NLP 之類演算法在這方面應用...

在機械人自動駕駛中，強化學習和slam哪個方向更有前景？

黎心鴉氣機 RL做控制在業界落地目前來看相對困難。業績用的一般還是pid或mpc。RL更廣泛的活躍在科研領域，出的新聞也一般是整花活的。SLAM我其實不是很了解，但從LinkedIn上那些職位上來看，要會SLAM的的崗位遠遠大於要求會RL的。李木蘭ya 強化學習是一種方法誒，slam是一種任務，這...

怎樣看待地平線機械人以深度強化學習演算法為切入點？

曾經參加了地平線在清華的兩次校招，當時對這家公司挺感興趣的。兩次校招的集思廣益環節我都說了這個思路，當時地平線相關Quattroporte堅定地說短期內不會採用DRL這個方案。沒想到啊，他們也走這個路線了，是跟風還是？期待吧 OFuture T 非常正確的路徑！deepmind現在已經漸入佳境，...

強化學習在機械人領域都有哪些成功的例子？

機器學習 深度學習以及強化學習在金融領域有哪些應用？

在機械人 自動駕駛中，強化學習和slam哪個方向更有前景？

怎樣看待地平線機械人以深度強化學習演算法為切入點？

其他用戶還看了：

機器學習深度學習以及強化學習在金融領域有哪些應用？

在機械人自動駕駛中，強化學習和slam哪個方向更有前景？