強化學習在機械人領域都有哪些成功的例子?

時間 2021-06-03 03:20:30

1樓:

這個時候就要祭出綜述了

劉浚嘉:【重磅綜述】如何在少量嘗試下學習機械人強化學習控制

對於強化學習在機械人上的應用,有以下幾點方針:

需要找到傳統控制方法難以實現的點,比如非線性時變系統、high-level的複雜決策;

需要概率化建模(可關注專欄的 PR/Probabilistic in Robotics 系列文章);

需要model-based來提高資料利用率(可關注專欄的 Model-based 系列文章);

需要先驗地恰當引入(可關注專欄的 Imitation Learning 以及RLfD 系列文章)

SOTA的機械人強化學習演算法有:

PILCO

Black-DROPS

IT&E

MF-ES

Black-DROPS with GP-MI and VGMI

Sim-To-Real methods

應用場景涵蓋雙足、四足、六足,AGV,串聯機械臂抓取、插孔等,均是部署在real-world機械人上。

RL in Robotics

專欄目錄

劉浚嘉:Reinforcement-Learning-in-Robotics 專欄目錄

機器學習 深度學習以及強化學習在金融領域有哪些應用?

GorgeousShar 據我所知,兩年前就有人做量化投資方面的交易了,但是收益嘛。因為資料一般是波段操作,這就導致了目前需要進行一些監督,並且演算法有限,現在還有些距離,個人期待AutoML能夠解決這個問題 gutu Granth 瀉藥,反洗錢反欺詐領域有很大的運用,NLP 之類演算法在這方面應用...

在機械人 自動駕駛中,強化學習和slam哪個方向更有前景?

黎心鴉氣機 RL做控制在業界落地目前來看相對困難。業績用的一般還是pid或mpc。RL更廣泛的活躍在科研領域,出的新聞也一般是整花活的。SLAM我其實不是很了解,但從LinkedIn上那些職位上來看,要會SLAM的的崗位遠遠大於要求會RL的。 李木蘭ya 強化學習是一種方法誒,slam是一種任務,這...

怎樣看待地平線機械人以深度強化學習演算法為切入點?

曾經參加了地平線在清華的兩次校招,當時對這家公司挺感興趣的。兩次校招的 集思廣益 環節我都說了這個思路,當時地平線相關Quattroporte堅定地說短期內不會採用DRL這個方案。沒想到啊,他們也走這個路線了,是跟風還是?期待吧 OFuture T 非常正確的路徑!deepmind現在已經漸入佳境,...