請各位機器學習大佬幫忙!!!請問有沒有一種分類演算法,可以根據特徵值得重要性來進行訓練資料?

時間 2021-06-10 04:24:19

1樓:Jack Stark

我覺得需要分兩種情況來看(假設模型是神經網路)。

如果你的資料中沒有表現出這種重要性,也就是說資料並不包含特徵重要性的資訊,那麼可以先歸一化資料,然後把特徵乘以權重就可以。這樣神經網路訓練的時候重要特徵的影響會更大一點。(這裡假設模型是神經網路等利用反向傳播的模型,如果是決策樹的話,這樣加權是沒用的)

如果這個重要性包含在資料中,比如說這個重要性的值就是你從資料中提取出來的,那就不要做任何操作了,只需要正常訓練即可,模型會自己去學習的。

2樓:小李

如果你是已經確定好了特徵的重要性,那麼可以把它作為羅輯回歸中的weight的初始值。然後演算法會自動調整。但是由於你已經設定好了初始值,那麼就會基於它來做。

當然最後可能學的完全相反,那麼說明你給的特徵重要性和實際訓練資料完全不搭邊。

同樣的,所有的模型都可以按照這個來。

如果你已經確定好了權重了,不需要學習,那麼就直接構造對映函式做就好了。

最後要分類的話,2分類用sigmoid,多分類用softmax就ok了。如果不需要學習,都不存在損失函式。,。。

Does this help you?

請各位大佬幫忙看看現在什麼狀態

自由的陌生人 是不是小白,在於對跑步知識的了解,在於自己對跑步的體會,而無關成績。成熟的跑者,都懂得,跑步要以健康為目的,以不受傷為準則,以自己的身體狀況為出發點,來確定自己的跑步計畫和目標。懂得體會身體的感受,懂得速度和耐力的結合,懂得跑前熱身和跑後拉伸,以及如何避免傷病。從這個角度來看,你還真是...

請各位大佬幫忙看看,我寫的怎麼樣!

Cloud Strife 無聊,很,看的很無聊,要裝逼就要有期待感,你把修煉寫出來,哪來的期待感?建議以後和人裝逼的時候再說自己修煉過往,你這樣寫,能拿100均算你狠 妄怨 看了第一章,銅鏡是金手指嗎?就算是金手指,也沒必要寫那麼長一段。第一章全都是設定沒有情節,聯絡一句話概括。主角死了,主角現在是...

十萬字申請簽約失敗了,想請各位大佬 知友幫忙看看都有哪些缺陷?

破碎的心 作為起了個名字酒再也沒寫的人來說,你動筆寫了十萬字不斷更真的是很棒了。感覺你不要氣餒,畢竟誰都要有成長的過程叭。書名感覺並沒有看下去的想法,沒有那種網文的感覺就是。簡介你這個和詭秘之主一樣的格式啊,我寫自己書的簡介時候特意看了看喜歡看的書的簡介來著,你這個算得上抄了,感覺不好,還是不要重複...