機器學習中常見的線性分類器有哪些?

時間 2021-05-06 17:55:22

1樓:梵為科技

機器學習中常用的線性分類器和非線性分類器知識了解

線性分類器有感知機,LDA,邏輯斯蒂回歸,SVM(線性核)。

它的模型是引數的線性函式,分類平面是(超)平面

非線性分類器有樸素貝葉斯,KNN,決策樹,SVM(非線性核)

它的模型分介面可以是曲面或者超平面的組合

兩者區別:

線性linear指量與量之間按比例、成直線的關係,在數學上可以理解為一階導數為常數的函式;非線性non-linear指不按比例、不成直線的關係,一階導數不為常數

線性的可以認為是1次曲線,比如y=ax+b ,即成一條直線;非線性的可以認為是2次以上的曲線,比如y=ax^2+bx+c,(x^2是x的2次方),即不為直線的即可

兩個變數之間的關係是一次函式關係的——圖象是直線,這樣的兩個變數之間的關係就是「線性關係」;如果不是一次函式關係的——圖象不是直線,就是「非線性關係

「線性」與「非線性」,常用於區別函式y = f (x)對自變數x的依賴關係。線性函式即一次函式,其影象為一條直線。其它函式則為非線性函式,其影象不是直線。

在數學上,線性關係是指自變數x與因變數yo之間可以表示成y=ax+b ,(a,b為常數),即說x與y之間成線性關係。 不能表示成y=ax+b ,(a,b為常數),即非線性關係,非線性關係可以是二次,三次等函式關係,也可能是沒有關係。

線性分類器感知機:感知機(或稱感知器,Perceptron)是Frank Rosenblatt在2023年就職於Cornell航空實驗室(Cornell Aeronautical Laboratory)時所發明的一種人工神經網路。在人工神經網路領域中,感知機也被指為單層的人工神經網路,以區別於較複雜的多層感知機(Multilayer Perceptron)。

作為一種線性分類器,(單層)感知機可說是最簡單的前向人工神經網路形式。儘管結構簡單,感知機能夠學習並解決相當複雜的問題。感知機主要的本質缺陷是它不能處理線性不可分問題。

線性分類器LDA:線性判別式分析(Linear Discriminant Analysis),簡稱為LDA。也稱為Fisher線性判別(Fisher Linear Discriminant,FLD),是模式識別的經典演算法,在2023年由Belhumeur引入模式識別和人工智慧領域。

基本思想是將高維的模式樣本投影到最佳鑑別向量空間,以達到抽取分類資訊和壓縮特徵空間維數的效果,投影後保證模式樣本在新的子空間有最大的類間距離和最小的類內距離,即模式在該空間中有最佳的可分離性。

線性分類器邏輯斯蒂回歸:LR回歸,雖然這個演算法從名字上來看,是回歸演算法,但其實際上是乙個分類演算法,學術界也叫它logit regression, maximum-entropy classification (MaxEnt)或者是the log-linear classifier。在機器學習演算法中,有幾十種分類器,LR回歸是其中最常用的乙個。

LR回歸屬於概率性判別式模型,之所謂是概率性模型,是因為LR模型是有概率意義的;之所以是判別式模型,是因為LR回歸並沒有對資料的分布進行建模,也就是說,LR模型並不知道資料的具體分布,而是直接將判別函式,或者說是分類超平面求解了出來。

SVM:SVM是乙個二類分類器(線性核、非線性核),它的目標是找到乙個超平面,使用兩類資料離超平面越遠越好,從而對新的資料分類更準確,即使分類器更加健壯。支援向量(Support Vetor):

就是離分隔超平面最近的哪些點。尋找最大間隔:就是尋找最大化支援向量到分隔超平面的距離,在此條件下求出分隔超平面。

特點:非線性對映是SVM方法的理論基礎,SVM利用內積核函式代替向高維空間的非線性對映;

對特徵空間劃分的最優超平面是SVM的目標,最大化分類邊際的思想是SVM方法的核心;

支援向量是SVM的訓練結果,在SVM分類決策中起決定作用的是支援向量。因此,模型需要儲存空間小,演算法魯棒性強;

無任何前提假設,不涉及概率測度;

SVM演算法對大規模訓練樣本難以實施

用SVM解決多分類問題存在困難

每天學習一點。。

2樓:Tom Hardy

LR,感知機、線性回歸,SVM,貝葉斯分類這些都算吧,其實線性分類器有個好處就是速度快,但是呢擬合能力不強,所以分類還是非線性做得好,比如決策樹、RF、GBDT、多層感知機、SVM(高斯核)~

3樓:奔跑的毛姆

線性分類器有三大類:感知器準則函式、SVM、Fisher準則。

感知器準則函式:代價函式J=-(W*X+W0),分類的準則是最小化代價函式。感知器是神經網路(NN)的基礎。

SVM:支援向量機也是很經典的演算法,優化目標是最大間隔(margin),又稱最大間隔分類器,是一種典型的線性分類器。(使用核函式可解決非線性問題)。

Fisher準則:更廣泛的稱呼是線性判別分析(LDA),將所有樣本投影到一條原點出發的直線,使得同類樣本距離盡可能小,不同類樣本距離盡可能大,具體為最大化「廣義瑞利熵」。

線性可分是一種比較理想的情況,真實世界中這樣的資料並不多見。一方面現實中的資料維度一般都遠大於二維,維數越多,資料的分布就越複雜,線性可分的可能性就越小;另一方面,即使target function是線性的,由於資料採集過程中的雜訊導致的非線性也是非常有可能的。這樣一來,感知器模型就無法廣泛地應用了

機器學習分類判別方法(一) Fisher線性判別

女生對女生說 愛你,麼麼噠。更多的是一種友情的表達吧。我腦子裡蹦出來的第乙個場景就是乙個女生跟另乙個女生說 我給你帶了水,要不要?然後 愛你,麼麼噠 然後說 我愛你 的話,天吶,作為乙個男生,我完全沒想過女生會和另乙個女生說我愛你,如果她們不是戀人關係的話。就算女生之間普遍比男生會表達友好的感情,我...

資料探勘中常見的特徵工程方法

jsldh 剛摔來回答一下.我是看那一排每台跑步機都有人了,剛好其中一台那個人下來了,我也沒看清他怎麼下的,然後就直接站上去,結果那個跑步機還沒停?速度賊快.我直接被滾下來了,痛死我了。最關鍵的還是旁邊一群人看著我.真尷尬死然後看了一下腿上摔的地方乙個青乙個紫。 廢柴芥末 人在健身房,剛摔下跑步機不...

生活中常見的精神控制有哪些?

心理櫥窗 生活中的精神控制無處不在,只是大部分在潛移默化的影響著我們,我們不得已,或者被動而為之。當然這些目前是社會允許的心理控制,無非是為了盈利,買買買的效果。姑且把這種操控心理也歸納為精神控制的一種吧 那麼什麼是精神控制呢 精神控制,指個人或者團體,用一些非道德的操縱手段來說服某人按照操作者的願...