統計學研究的難點在於資料的獲取還是統計方法的複雜?

時間 2021-05-09 03:38:40

1樓:

改一點點題目,我覺得是資料的複雜性

這種複雜性不光體現在資料的難於獲取上,還體現在資料的不確定性上(uncertain)

相對應的,我們對統計學了解的太少了,我們知道的統計方法都太簡單了,以至於沒有辦法從資料中智慧型地提取資訊。這才導致了資料分析的難點

乙個美好的願景是,我給機器一組資料,告訴它我要什麼,他就可以智慧型分析出一組報告

然而很可惜,至少暫時來看,資料分析還是乙個主觀和經驗的過程,沒辦法讓機器完全代勞。一些trick都可以進行互相替換甚至交叉(例如線性回歸裡面的l1懲罰和逐步回歸),選擇哪個?如何評判哪個好?

每個人心中都有不同的答案,甚至不同的任務會帶來不同的結果。

同樣,特徵提取和資料清洗環節更是如此,主觀性太大了。

總之,還是我們知道的東西太少了。

2樓:少年

這兩個是一體的,資料分析方法建立在資料上。

有時候資料難獲取就要在方法上想辦法,比如天文學,醫藥學等等這種實驗昂貴的學科。

有時候資料質量較低,就要想辦法清洗資料。

總的來說,資料樣本量越大,能用的方法越多。

3樓:Michael Li

和田忌賽馬一樣,資料獲取和統計方法都有最複雜的馬、次複雜的馬,普通複雜的馬,要看怎麼比了。(馬代指問題)

以前我會覺得方法難於獲取,因為我在學習方法過程中並沒有實際真實做獲取工作。

但是從流行的大資料趨勢上而言,獲取資料成本(金錢、時間、精力、體力)的進步要比統計方法的發展要快,從這個角度想,大約統計方法會更複雜一些吧

4樓:

測序真費錢。比如轉錄組單細胞測序,乙個細胞一美元起,少說千把個細胞

這個不算,養細胞要錢,培養基要錢,基因編輯要錢,給你做實驗的phd、tech要付工資

這個後續統計反而是最好做的,測序公司會有一套自己的pipeline作為配套服務送你,guidance也送,至少做出個能用的input data還是很簡單的。組個小伺服器2w就很不錯了,再不濟拿自己的遊戲本跑(emmm,我就幹過)

但是說實在的,剩下的玩意兒就簡單了,pca,t-sne,go/kegg enrichment等等,當調包俠就可以了

但是往往發現自己測出來結果是一坨翔,啥想要的玩意兒都解讀不出來........少俠重新來過吧.........

(鍋?我不背,誰做溼實驗誰背)

所以對我而言,把統計學結論結(qian)合(qiang)落(fu)實(hui)到實際意義上可能更難

5樓:嗚啦啦啦

顯然是後者啊。

前者是資料探勘幹的事。。

當然,對於統計工作者,可能兩者都很重要。但是對於統計學研究,尤其是傳統統計學,著重點在於統計的性質。

統計學與大資料的區別?

四郎 作為乙個統計學生,不應該因大資料這個新萌的出現而浮躁。相反,統計理論還要更加紮實嚴苛,資料面臨的挑戰反而更大,對統計學的底子要更深刻熟練才能把控好大資料的精確度和質量,更大地實現大資料的價值。抽樣技術不可能被丟棄,由於混雜性,大資料和真正的總體是有差距的,而且由於規模太大容易出現滾雪球式誤差擴...

大資料時代,統計學方法有多大的效果?

xj ken 在如今資訊量超載 學習無法根據變化的資訊化時代,大資料 人工智慧得以快速發展。作為個人學會簡單的統計方法,無論是在生活中,還是工作上,都會帶來無與倫比的優勢。我結合對一次初創專案分類統計的研究,作一次小白級的 排序統計 測試。原文如下 通過BetaList分析近年的創業專案分類風向標 ...

有什麼對統計學研究生的建議?

貝葉斯統計的優勢在於,在資料少的情況下也可以進行推測,資料越多,推測結果越準確 以及 對所獲的資訊可做出瞬時反應,自動公升級推測 的學習功能。了解了這一點之後,就完全可以理解為什麼貝葉斯統計是非常適合應用於高階商業的技術了。 牛津金融學長 有很多想說的 學習方面,很多人有經驗,但是路只能自己走。我只...