怎樣看待地平線機械人以深度強化學習演算法為切入點？

1樓：

曾經參加了地平線在清華的兩次校招，當時對這家公司挺感興趣的。兩次校招的「集思廣益」環節我都說了這個思路，當時地平線相關Quattroporte堅定地說短期內不會採用DRL這個方案。沒想到啊，他們也走這個路線了，是跟風還是？

期待吧~

2樓：OFuture T

非常正確的路徑！

deepmind現在已經漸入佳境，從早期的DQN到現在的DDPG，離問題的實質越來越近，相信他們在10年內會有突破性的成果。不得不佩服google的眼光，超過其它大佬好大一截。

3樓：顏沁睿

主要還是task的問題，機械人方面的很多task本身就很適合於用Reinforcement Learning解決，中間的state-action空間太大，uncertainty太多，人很難用其它模型把他們都表示出來。用deep learning簡單粗暴，只要能想辦法把它弄收斂就行了，目前看起來還是挺有戲的。如果要是能用graph模型整出來的話肯定比deep learning好啊，省計算省空間還能解釋清楚，這就得看學術界的了，正在看這方面，覺得智商無法支援。。

額, 快半年前發的了, 稍微編輯一下吧.

這半年的主要精力放在了visual slam的部分, 對DRL沒有再做仔細的思考, 可能到下半年去地平線以後會再根據專案撿起來. 這兩年DL大火, 主要還是影象語音方面supervised learning的成果, 應該說supervised learning的侷限是有目共睹吧, 通過這半年follow的幾門ML相關的課程來看, 老師們的授課重點都已經放在unsupervised和semi-supervised上, 傳統的supervised版本ANN, SVM都被當成了常識, 一兩節課帶過. RL更像是high level一點的思想, 無關supervised或unsupervised的事情, 只要對RL問題的求解有幫助都可以拿來用.

比如award函式可以用CNN來learn, 日後可以換. 機械人框架可以分為perception, planning, control三部分, 按照俺老師的說法, control可以算是well studied了, perception這些年有賴DL進展也不小, RL正好做planning, 中間一串起來, 整個系統就可以work起來了. 個人覺得pieter他們那樣end to end也不是必須得, 只是聽起來比較炫酷, 總之這還是個坑很大的方向, 繼續關注著吧...

4樓：張大帥

要說實用和效果，如果不是資料量特別少的領域，現在還真得是首推deep learning。

特別是在工業界，圖模型、Bayesian系的東西，理論上雖然很好，但是不是算不動就是推不出，很難work，只有神經網路，簡單實用好實現，（基本）不用推導易訓練。只要資料量夠，一定還你乙個好效果。

怎樣看待地平線機械人以深度強化學習演算法為切入點？

在地平線機械人（Horizon Robotics）工作，以後發展前景怎樣？

offer選擇華為海思 vs 地平線機械人？

在地平線機械人工作或實習是一種怎樣的體驗？

其他用戶還看了：

怎樣看待地平線機械人以深度強化學習演算法為切入點？

在地平線機械人（Horizon Robotics）工作，以後發展前景怎樣？

offer選擇 華為海思 vs 地平線機械人？

在 地平線機械人 工作或實習是一種怎樣的體驗？

其他用戶還看了：

offer選擇華為海思 vs 地平線機械人？

在地平線機械人工作或實習是一種怎樣的體驗？