怎樣看待地平線機械人以深度強化學習演算法為切入點?

時間 2021-05-13 06:39:55

1樓:

曾經參加了地平線在清華的兩次校招,當時對這家公司挺感興趣的。兩次校招的「集思廣益」環節我都說了這個思路,當時地平線相關Quattroporte堅定地說短期內不會採用DRL這個方案。沒想到啊,他們也走這個路線了,是跟風還是?

期待吧~

2樓:OFuture T

非常正確的路徑!

deepmind現在已經漸入佳境,從早期的DQN到現在的DDPG,離問題的實質越來越近,相信他們在10年內會有突破性的成果。不得不佩服google的眼光,超過其它大佬好大一截。

3樓:顏沁睿

主要還是task的問題,機械人方面的很多task本身就很適合於用Reinforcement Learning解決,中間的state-action空間太大,uncertainty太多,人很難用其它模型把他們都表示出來。用deep learning簡單粗暴,只要能想辦法把它弄收斂就行了,目前看起來還是挺有戲的。如果要是能用graph模型整出來的話肯定比deep learning好啊,省計算省空間還能解釋清楚,這就得看學術界的了,正在看這方面,覺得智商無法支援。。

額, 快半年前發的了, 稍微編輯一下吧.

這半年的主要精力放在了visual slam的部分, 對DRL沒有再做仔細的思考, 可能到下半年去地平線以後會再根據專案撿起來. 這兩年DL大火, 主要還是影象語音方面supervised learning的成果, 應該說supervised learning的侷限是有目共睹吧, 通過這半年follow的幾門ML相關的課程來看, 老師們的授課重點都已經放在unsupervised和semi-supervised上, 傳統的supervised版本ANN, SVM都被當成了常識, 一兩節課帶過. RL更像是high level一點的思想, 無關supervised或unsupervised的事情, 只要對RL問題的求解有幫助都可以拿來用.

比如award函式可以用CNN來learn, 日後可以換. 機械人框架可以分為perception, planning, control三部分, 按照俺老師的說法, control可以算是well studied了, perception這些年有賴DL進展也不小, RL正好做planning, 中間一串起來, 整個系統就可以work起來了. 個人覺得pieter他們那樣end to end也不是必須得, 只是聽起來比較炫酷, 總之這還是個坑很大的方向, 繼續關注著吧...

4樓:張大帥

要說實用和效果,如果不是資料量特別少的領域,現在還真得是首推deep learning。

特別是在工業界,圖模型、Bayesian系的東西,理論上雖然很好,但是不是算不動就是推不出,很難work,只有神經網路,簡單實用好實現,(基本)不用推導易訓練。只要資料量夠,一定還你乙個好效果。

在地平線機械人(Horizon Robotics)工作,以後發展前景怎樣?

前員工來描述一下 1,不管你水平如何,都不要表現太突出,欣慰這裡的leader 都是仗著來得早佔住坑位的弱雞,你太突出那你就是leader 的眼中釘,肉中刺 3,各級之間相互糊弄,因為leader 們根本不懂也不關心更不知道一件事下面的人是怎麼做的,做了什麼,他們只關心保住自己的位置,等公司上市或賣...

offer選擇 華為海思 vs 地平線機械人?

先說結果 選華為 地平線優勢 起薪高 地平線劣勢 企業後期發展不穩定,意味著後期薪資漲幅不穩定。華為優勢 平台大,只要好好做工資總會漲,當然你評級總不過關那就是實力問題了。 趙辰 地平線不了解。只說說海思。首先,隨機定崗並不是絕對的,剛入職會讓你去接觸乙個崗位的工作,新員工嘛,不會讓你承擔太多責任。...

在 地平線機械人 工作或實習是一種怎樣的體驗?

小炸雞鐘熊 第乙份實習就在地平線 產品組氛圍真的nice 實習生也有出差的機會哈哈很多事情也有話語權永遠感恩感謝感激車聯網事業部的夥伴們! 18年來的公司實習。剛來公司的時候,由於整個部門沒HC,就先招了我這個實習生來頂著。大牛很多,經常可以看到很多大牛出差來office,福利很好,每週有各種下午茶...