這次dmlc發布的深度學習框架mxnet比之caffe有什麼優缺點?

時間 2021-05-07 07:59:21

1樓:王潛

這個問題回答的人好少啊

mxnet主要是繼承自Minerva和cxxnet,cxxnet的特性 @李沐 在樓上已經說了,既然Minerva的開發者們不在知乎出現,作為當初的合作者我就冒昧說幾句我知道的吧

當初做Minerva的目的是提供乙個可以快速實現原型演算法的系統。從前開發演算法一般首先是在小資料集比如MNIST上,用matlab或者python實現乙個最基本的結構看效果,之後逐步放大推廣。但這種模式已經跟不上時代了,隨著方法的效果越來越好,MNIST這類小資料集正在逐漸失去檢驗演算法的作用,越來越多的新方法從一開始提出就是執行在GPU和大資料集上的,因此迫切需要能夠快速在並行/GPU上建立演算法原型的工具。

因為這些演算法可能是千奇百怪的,所以給使用者足夠的靈活性操縱盡可能多的東西很重要;因為要快速開發和做ML的人精通GPUcoding不容易,所以這個系統要像matlab一樣用起來盡可能簡單和抽象,讓使用者專注到演算法而不是coding細節上去。

正因如此,Minerva最重視的特性是靈活性,使用者可以很自由的控制模型從結構到訓練的絕大部分特性;其次是易用性,比如Minerva對Python(現在有很多別的語言)的介面支援做得很好。我想對靈活性的追求應該是Minerva區別於caffe(實現基礎演算法更方便但開發新演算法不靈活)最大的不同了。(儘管如此,Minerva的效率和可拓展性仍然非常優秀)

技術實現上Minerva(第乙個)用了data flow,最後的結果很好的兼顧了靈活性和效率的要求。雖然我完全不懂System,但感覺這是乙個很優雅的工作。所有這些應該都被mxnet繼承了(我很久沒有follow過了,所以對近況不是很了解),據說又融合了cxxnet的優點(mxnet的parameter server部分據我了解應該完全屬於cxxnet),我是很期待這個系統的。

深度學習框架 如tensorflow pytorch 如何驗證複雜tensor的運算是否按照期望工作?

帶你飛 首先需要明確各個緯度的意義,然後在進行運算的時候,不妨把batch設定為1,多看幾遍運算結果,理解各個緯度的作用關係,加上一些時間積累,就能夠做到準確無誤的使用各種矩陣操作 eddy 你可以設計有規律的輸入,比如從1到9 假設輸入是3 3矩陣 然後看輸出是也存在對應規律,還有就是可以用ten...

如何評價Python的深度學習框架DeepPy?

智星雲服務 專案 Deepy 簡介 它使用numpy進行計算。API類似於PyTorch的API。在示例目錄中有乙個線性分類器,其準確率超過96 from deepy.module import Linear,Sequentialfrom deepy.autograd.activations imp...

深度學習框架有哪些?各有什麼特點?

去太平洋游泳 說到深度學習框架,國內外框架有幾十種。最流行的還是那幾個,caffe,tensorflow,pytorch。caffe是面向c 的 2016年底谷歌開源了深度學習框架tensorflow,在社群火熱程度超過了caffe.因為上手快,python比c 好學。後來出來了pytorch,因為...