去掉冗餘特徵,會使模型的評估指標下降,這時要不要去掉這個冗餘的特徵呢?

時間 2021-05-11 09:51:39

1樓:螞蟻不線上

你的模型評估指標是在什麼資料集上的呢?如果是測試集,就以模型評估指標為準。這是最有資格說話的裁判。

只要你的資料集設定沒有問題,那就應該以測試集上的評估指標為準,注意,不是驗證集。

邏輯回歸模型由於是特徵直接參與計算,特徵相關性太高會導致模型拉胯,但這會在測試集上表現出來;樹模型沒有這個缺陷,變數相關性分析意義不大。

2樓:TiuVe

個人覺得不要吧。理論上剔除乙個特徵等於減少了資訊量,效果要麼維持原狀要麼降低。如果效果下降了就保留該特徵吧。

我覺得如果乙個特徵和其它所有特徵都不相關,是可以直接剔除的。話說回來,如果兩個變數相關性達到90%以上,去掉乙個應該效果差不多才是,是否考慮再調整下模型引數呢?題主可以描述的更詳細些,包括用了什麼模型,是乙個什麼樣的優化問題,這樣更方便大家幫你分析。

3樓:bemyself24

還是要以模型的評估指標為主吧,因為你做的相關性分析有時候並不能準確代表兩個變數之間的相關性,這種情況還是比較常見的。就像有時候用lightgbm或者xgboost計算特徵重要性的時候,刪去特徵重要性為0的特徵,模型效果反而會變差,和這種情況是類似的。因為你的特徵相關性分析方法得出來特徵是相關的,但是對於有些模型來說,可能會用到這個冗餘特徵和其他的特徵組合成交叉特徵,這種情況是有可能發生的。

因此,在做特徵篩選的時候,需要使用多種方法,變數相關性分析,對比實驗等要綜合考慮,最終還是以模型的評估指標為主。

去掉言情的女頻玄幻會撲街嗎?

姞雪心 我的 蜀山風雲錄 就是這麼寫的,然後訂閱撲街了。不過因為主線和設定可塑性大,腦洞也足夠新鮮,因此作為影視後備簽了保底,僅此而已。然後,這類題材我還會繼續寫下去,但恐怕要再過兩 三年了。 社會貓 不要拘泥於型別,只要你寫得足夠好,型別問題不大的。其實作為乙個女孩子,之前看男頻玄幻很爽就是很煩感...

如果Clannad去掉最後一集會怎樣

宵待雨月 就個人來說,我是不太認同這個有一定幻想色彩的結果的。但是如果說把最後一集去掉,那麼小女孩和機械人的事情便是冗雜的,完全無用的。但作者寫出這個東西必然有他的初衷,對於這個事件,我認為這個東西就是 鼓勵觀眾追求自己的夢想,實現自己的理想。即便是把所有幻想世界都去掉,刪去GE,變成乙個BE,是和...

你們的雀斑都是怎麼去掉的,有雀斑真的會很自卑嗎?

雀斑的出現一直是愛美女性的一大討厭的話題。一旦雀斑出現在臉上,去除雀斑的過程可以說是非常困難的。相信沒有人願意看到臉上全是雀斑,但事與願違,相信這情況並不少見。實際上,只要選擇正確的方法,仍然有機會消除這些雀斑。如果你也被這些煩人的雀斑困擾,如何消除雀斑才有效呢?來看看這篇文章吧。安全有效的去除雀斑...