如何評價戴文淵《詳解機器學習教科書七大經典問題》?

時間 2021-05-05 19:50:29

1樓:賀勇

說的是不錯,每一條最後落腳點都是看具體實際場景,但是教科書是針對一般情況來說,所以說教科書只是知識的一般講述,而具體實踐才是個人修為.

2樓:

確實是很基本的問題。

在部分人迷信暴力出奇蹟堆砌運算力的N年前也算是清流。

不知道國際頂尖研究現在是個什麼傾向。現在問題就在這裡,不知道有沒有比較好的解決辦法。

從應用方面講,積極意義比較大。探索機制方面,總覺得不太夠。

3樓:梁召

五:正樣本和負樣本均衡取樣到1:1

按照我在工業屆的經驗,這一條是不全面的。

簡單來說,用簡單分類器的多層級聯模型(cascade),消耗的資源遠小於乙個不需要均衡取樣的複雜分類器,而效果可以一樣。

訓練時需不需要均衡取樣,這主要看分類器。通常較強的分類器是不需要均衡取樣的,在學術界也是一樣的,例如最早用FCN做影象分割(即畫素分類)的那篇文章就有一段專門說加權取樣沒有幫助。

反而是在工業界,考慮到記憶體、速度、gpu之類的限制,有時用不了那麼強的分類器。

實際工作中遇到分布不均衡的資料,用級聯模型解決就好。也就是用第一層分類器輸出為正的樣本上,再跑乙個分類器。

對乙個正負1:100的資料,用均衡取樣訓練乙個兩層的級聯模型,兩層都用均衡取樣做到準確率99%

測試過程中,跑完第一層級聯,正負樣本比本身就接近1:1了。

當然,實際工作中,每層級聯會通過改變閾值從而更傾向於提高正樣本的查全率(recall)。 樣本不均衡越多,級聯層數越多。

4樓:見賢

存在啊,其實戴文淵都已經給出了工業界/學術界上實際的活生生例子。

1.網路不超過3層

VGG、resnet,inception什麼的,不都是堆得又高又大?從實際的隱層資料來看,影象的抽象能力也是逐漸從低往高。以前沒3層的網路,一是沒那麼多資料,二是沒那樣的運算能力。

3.特徵選擇不超過一千

這個一般是教科書上,特徵是連續值的情況。在實際工業界上,基本上是ID類特徵,比如cookie,site,url什麼的離散特徵,動不動就十幾億上百億。離散特徵有個好處,就是記憶能力比較好,泛化能力弱一些。

5.正樣本和負樣本均衡取樣到1:1

在很多場合中,正負樣本取樣根本不會到1:1,能有1:100就可以偷笑了好嘛。

工業界做負樣本取樣是從資源的利用角度出發,能不取樣一般都不取樣的,不然分布就會變化,雖然能做calibration,但這種做出來的東西還是有偏的。

6.交叉驗證是最好的測試方法

你做模型的最終目的是為了去預估未來資料的表現,你直接按照時間點為分割點,分割點以前的用做訓練,時間點以後的用做評估。

如何評價SF9李達淵?

雖然我在團裡最喜歡不是達淵,但他依舊是個讓人值得喜歡的人。他懂得活躍團的氣氛,也會細心地照顧弟弟,陪澯熙一起空腹那裡真的好好 在隊裡一直不爭不搶,但出了隊就不一樣了,會有勝負心。有著極強的團魂。每次看到他吃成員以外的人的醋時,我就覺得他真的好像乙個小孩一樣,很可愛。達淵因為經常搞笑不好好用臉,但認真...

如何評價《深紅累之淵》這部漫畫。?

評價就是 這是一部情節誇張,精神世界寫實,且價值觀正確的漫畫。看完後的感覺就是 世界上相貌殘缺的人不在少數,但他們每個人都會本能地在這個世界上為自己尋乙個位置。在這個位置上或許沒那麼舒服,但絕對不會太痛苦地活著。可是小累,天生相貌殘缺,卻對演戲愛得深沉。她越是朝著自己所愛前進,相貌殘缺這個事實帶給她...

如何評價戴莫

初心Cp就是戴莫。心旅那時候感覺太好了,也有回應。今年2019年基本看不得 沒什麼互動了 看得我這個難受唉 主要是喜歡她倆的在一起的感覺,這是我個人觀點 僅僅代表自己 反正就是她倆在一起就安心那麼傲嬌的乙個人在老戴面前撒嬌真的配一臉讓我感覺又相信愛情了哈哈哈哈畢竟是長在莫莫淚腺上的她 也不知道be沒...