用於資料探勘的分類演算法有哪些,各有何優劣?

時間 2021-05-12 05:27:04

1樓:哈哈哈

卷積神經網路應該是一種經典的分類方法。

卷積神經網路

在普通卷積神經網路的基礎上,又衍生出一系列的新方法。

其中,最知名的就是殘差網路ResNet[1]。

ResNet在卷積神經網路中新增了跨層恒等對映,緩解了深層網路的訓練難度。

殘差網路

在殘差網路的基礎上,又衍生出了殘差收縮網路residual shrinkage network[2]

[3]。

殘差收縮網路採用了軟閾值函式作為其中一層,更適合含雜訊資料的分類:

殘差收縮網路

2樓:陳無左

以下是個迅速的回答:

1. 這個問題本身是個meta-learning,即對方法進行分類-> 不可能有定論,以上抽樣舉例式的回答是一種回答方式,這裡嘗試從抽象層面進行回答。

2. 總體上總是可以分成高維方法和低維方法。高維亦即非引數模型,低維即引數模型。顯然,非引數方法集之於引數方法集如同無理數集之於有理數集。

3. 引數方法的乙個大塊是線性模型,統計中這叫回歸,數學中這叫投影。這反映了乙個應用數學式的思路:

一開始問題總是無窮維的,然後開始用投影進行降維,同時加上向量空間假設,而所有非線性的部分全部扔到座標軸內部。

4. 引數方法的另乙個大塊是分布模型,基於似然函式的方法(極大似然)和貝葉斯(先驗x似然=後驗)。分布模型本質也是降維,把問題降到低維度的引數空間裡,並且允許樣本誤差的存在。

事實上線性模型在統計觀點下也是乙個分布模型,應變數的分布。這樣一來回歸的多變性不僅在於投影基向量的構造,還在於應變數分布的概率模型。這是高於應用數學思想的。

5. 當然還可以有別的引數方法。

6. 非參模型的一些例子前面的回答已經提過不少,如kernel,決策樹,boosting,bootstrap等等等等。

大資料演算法和傳統的資料探勘演算法有什麼顯著的差別?

Tony 我個人覺得這是兩個不同時代的東西,就像功能手機和智慧型手機有什麼顯著差別?雖然二者的本質都是資料來源 資料工具 模型演算法這三要素,但場景完全不一樣,是量級的差異。比如銀行傳統的資料探勘,基本使用的是交易資料,而現在機器資料和網際網路行為資料也納入進來,資料量和分析的維度複雜的多。還有乙個...

機器學習,資料探勘的書有哪些?

袖裡乾坤 Kevin Murphy 和周志華比較現代 王禮 資料分析方面較經典的書 輸入淺出資料分析 深入淺出統計學 精益資料分析 Excel應用大全 等 資料探勘較好的入門的書 資料探勘概念與技術 Clementine資料探勘方法及應用 信用風險評分卡研究 機器學習 R語言實戰 利用Python進...

大資料 資料探勘在交通領域有哪些應用?

miao君 關於應用場景,樓上的知友們已經說了很多了,不過說的大多都是城市交通建設方面的大資料應用。那我就來講講大資料是如何被應用在交通運輸領域的企業裡的,帶大家感受下資料具體的魅力吧。唯捷城配大家應該不陌生吧,B2B倉配物流的頭部企業,和華潤萬家 沃爾瑪 百果園等都有合作。隨著公司的發展,其原有的...