在機械人自動駕駛中，強化學習和slam哪個方向更有前景？

1樓：黎心鴉氣機

RL做控制在業界落地目前來看相對困難。業績用的一般還是pid或mpc。RL更廣泛的活躍在科研領域，出的新聞也一般是整花活的。

SLAM我其實不是很了解，但從LinkedIn上那些職位上來看，要會SLAM的的崗位遠遠大於要求會RL的。

2樓：李木蘭ya

強化學習是一種方法誒，slam是一種任務，這倆不是同概念的事物。你可能想問的是基於強化學習的任務(比如目標檢測，路徑規劃)與slam相比的潛力～

3樓：Min

機械人 slam 強化學習沒啥實際應用成功例子自動駕駛也不用slam 有高精地圖那最多是個對齊和查詢不過做機械人沒啥掙錢的產品所以也不一定有前途 slam在手機的ar應用前景不錯

4樓：哭蘋果

兩個方向都搞過一些，建議選SLAM。強化學習一直都是聽起來好聽，實際用起來，誰用誰知道。SLAM比較綜合，進可以做理論，退可以搞應用。

5樓：啊淞

學控制理論的我想說控制理論更有前景，雖然有點王婆賣瓜，自賣自誇，但是還是要說任何自動控制系統都離不開底層控制理論，雖然知乎普遍看不起傳統控制理論（偷偷說一句，我是分數階控制方向的）

6樓：WEYSUV

機械人是機械人

自動駕駛是自動駕駛呀。

機械人的行當實在不太懂，還是說說自動駕駛吧。

自動駕駛的終點，應該是人類輸入指令之後，汽車按照程式規劃路線，並且按照程式對行駛中感測器探測到的結果做出處理。

自動駕駛雖然是智慧型化領域，但是其實不要求程式有自主思考能力和學習能力，僅僅是要求可以按照實際情況做出簡單的判斷。

簡單說就是分成幾大類

1、按照路線出現轉彎時進行變道和轉向。

2、根據探測結果發現障礙進行減速或者剎車。

所以說，智慧型化領域其實是很寬泛的，程式就是簡單的判斷：直行/轉彎/變道；有障礙-減速/剎車。（這是最最基礎淺顯的描述方式，實際情況要更複雜，包括行人的探測，後車加速和超車動作的預警等等）

舉個及其搞笑的例子：如果程式裡設定的是兩車追尾就減速繞行，三車追尾就停車，那麼程式遇到28車連環相撞，可能就抓瞎。智慧型化的自動駕駛，跟人工智慧關係沒有人想的那麼大，跟自主學習能力也沒有那麼大關聯。

程式怎麼設計的，就怎麼處理就行了。

而實際上當下自動駕駛的難點也不在程式處理，而是探測感測系統是否能夠識別道路上的一切，比如交通標誌，比如汽車、行人、非機動車，甚至貓貓狗狗和漂浮的塑膠袋。

就像早期的L2級別自適應巡航在測試的時候，可以說大部分主動剎車對路上的紙箱子檢測都偏慢，效果都不好，但是如果是偽裝成車輛或者行人的障礙物，則可以輕鬆識別。這也是現在大家進入L3之前，所改進的主要內容。

如何識別漂浮的塑膠袋，是當下最難的事情。

7樓：YANG

RL在不止在自動駕駛領域，在更廣義上的現實問題都有比較大的部署障礙。以下說一些個人的理解。

從RL本身來說，現在的基本說RL就是DRL滿天飛，大部分研究model-free的演算法可解釋性幾乎為0，在遊戲或者虛擬環境裡跑倒不是什麼問題，但應用在實際環境中有很大問題。

如果感興趣RL在實際應用的話，可以去關注一些model-based的方法，一般實際場景中部署的機械人都是有任務模型的。

slam方面了解不太多，不敢瞎白話，感覺是乙個比較成熟的領域。

利益相關，也是做機械人的planning under uncertainties方向的博士生。

8樓：大可奇

個人傾向於搞DRL，畢竟除了自動駕駛DRL所學的技能還可以（很方便地）遷移其他領域。

你搞SLAM以後相對受限很多。

本科搞個DRL 以後碩士階段的面會比較寬廣的~

9樓：

本科生選科研方向就不用糾結那麼多工作和工業應用了，選SLAM，不為別的，就為了push自己多學點數學和C++。而且硬體也簡單，不需要GPU，隨便一台筆記本都能跑。

強化學習，最後你就是在那調參，等結果，刷知乎。

10樓：

本科生，還不如好好學習數學，學習機器學習基礎知識，然後再想自己選擇什麼樣的方向，個人覺得，RL如果想落地的話，不能看成是乙個類似玩遊戲一樣狹隘的定義，應該把他看成是乙個思想。所以不是光學RL就夠了，感知、推理都帶接觸。

11樓：WangC

SLAM更有前景。

1. 單純DRL是在不斷試錯的基礎上實現的，這現實工業應用是不能容忍的。工業應用和交通的錯誤成本非常高，肯定不能出現機器撞壞了或者人員受傷了，因此強化學習不適用。

從這也可以得出，為什麼目前強化學習應用在遊戲、推薦系統中比較多，因為這些場景的試錯成本低。

2. DRL的實現是靠獎勵約束的，獎勵條件越多，DRL實現得更快更好，但是獎勵條件的構建需要引入大量的人類先驗知識。可惜這種人類先驗知識的遷移性較低，也就是說不同的任務，可能獎勵設定是不同的，需要人為的去除錯，這需要大量的時間和經驗。

而工業和實際應用則獎勵的設定最好是一種通用的，或者稍作調整。

3. DRL演算法的可遷移性低。當演算法在乙個域實現後，如何在另乙個域也可以工作，這是乙個問題。

可遷移性不僅是強化學習，同時也是深度學習需要解決的事情。很多學者都致力於這方面問題的解決。

12樓：

slam是個定義和目標非常完備且可做的東西越來越少的領域，畢竟有完備的定義和目標，你能做的只能是無限逼近ground truth而已。

不過這個問題底下，做RL的推薦slam，做slam的推薦RL，可見這倆都是未來天坑，都不要做。

13樓：FXCarl

本科還是做強化學習吧，不是 slam 難度勸退。是你看看光知乎有多少人搞 slam ，等你畢業不是要捲翻天？

這樓裡勸題主搞 slam 的大部分是現在要解決 slam 問題的。等您把 slam 基礎搞完研究透，研究生出來，市場早就飽和了。

自動駕駛車上需求 slam 的幾個場景其實現在都在量產解決的邊緣了。看看幾個資料集的里程計表現，誤差都在 1% 了。工程師搞搞就算了，學生還做個啥勁兒啊~

強化學習的領域則隨便都是未見重兵入場的藍海。近年不是時髦 L2+ 強智慧型路線麼，我們就談個性化的超車體驗這事兒中的乙個小小的切口吧：跟車中，要不要變道？什麼時候？

你可以搜搜這個問題有多少相關成果，多少人在做。有哪些研究角度。沒機器學習方法搞不搞的出因人適配。

好了，我就說這些了。

14樓：鸑鷟

slam，原因只有乙個，rl沒有明確的評判標準。

這個和slam裡面路徑規劃不火，建圖和定位火是乙個意思。

沒有kpi哪兒有錢和前途。

15樓：

RL據我所知國內沒有自動駕駛的廠在用，別選這種market size太小的方向。

SLAM明顯會好一些。而且推薦你做雷射SLAM，因為視覺目前問題還是比較多，精度上很難滿足需求。

在機械人自動駕駛中，強化學習和slam哪個方向更有前景？

自動駕駛汽車和智慧型機械人（如建築機械人等），兩個行業更看好哪個？

強化學習在機械人領域都有哪些成功的例子？

機械人司機是否可以成為自動駕駛新的解決思路？

其他用戶還看了：

在機械人 自動駕駛中，強化學習和slam哪個方向更有前景？

自動駕駛汽車和智慧型機械人（如建築機械人等），兩個行業更看好哪個？

強化學習在機械人領域都有哪些成功的例子？

機械人司機是否可以成為自動駕駛新的解決思路？

其他用戶還看了：

在機械人自動駕駛中，強化學習和slam哪個方向更有前景？