怎麼學習用 R 語言進行資料探勘?

時間 2021-05-12 13:24:44

1樓:劉小雙

最近一直在關注乙個叫FinanceR的專欄,作者更新速度很快,內容也是對的起業內良心呀。

鏈結在此,不要謝我!

FinanceR - SegmentFault

2樓:

學習資料探勘光會用R裡的package是不夠的。如果給你乙個真實的dataset(不是書裡給你做練習用的資料),你怎麼選擇模型呢?

建議樓主先不要糾結於R語言怎麼用,而是先學習一下各個演算法的原理和優劣。都弄清楚了以後再選任意一門語言上手都是很容易的事情。建議的學習順序是:

linear regression

lasso/ridge/other regularized regression (根據自己的需要可以學習一下time series)

LDAlogistic regression

classification problems (tree, clustering, PCA, etc)

推薦一下這學期在上的一門課Data Mining (<-鏈結). 練習都是用R做的。題主感興趣的話可以做一下course website上的練習。

(Edit: 學期結束後上面那個鏈結貌似被prof拿掉了(抱歉!),Data Mining (<-鏈結).

這個是前兩年的data mining,作業也是用R做的。教授是Ryan Tibshirani, 大名鼎鼎的那個Tibshirani的兒子。課的內容應該有很多重複之處。

銷售怎麼進行資料分析?

黃浦江畔 複購率是其中的乙個維度,當然這個維度也能反映客戶對商品或品牌的忠誠度。關於銷售方面的分析可以從如下幾個方面進行 商品維度 例如明星商品是哪些?哪些商品熱銷並符合了二八原則?通過挖掘演算法,將不同的商品進行聚類,即回答哪些商品從被購買者的角度認為是相似的 品類維度 品類是對商品的彙總,可以分...

打算學習用C語言進行linux網路程式設計,求推薦學習路徑?

紫堇花語 1。譚浩強的c語言,看看基礎語法,2。c語言指標熟練,大部分常用庫函式知道怎麼用3。然後deepin系統的命令列 4。gcc學會,折騰點簡單的socket 5。看看tcp ip,然後makefile,6。這時候沒有gdb就很難受了 7。高階,看 那些人家林林總總的原始碼和書 陶百百 假設你...

如何使用深度學習內容進行資料降維或特徵篩比如用20個特徵項,也就是20維資料,降低為8維。風速資料。

小宋是呢 這個實戰部落格可以幫到你 Keras深度學習淺嚐 實戰五 使用DNN自編碼器實現聚類運算元據降維 https blog.csdn.net xiaosongs hine article details 85164237 kai.han 前面的答主提到了用auto encoder做特徵降維,其...