統計學與大資料的區別?

時間 2021-05-08 22:05:07

1樓:四郎

作為乙個統計學生,不應該因大資料這個新萌的出現而浮躁。相反,統計理論還要更加紮實嚴苛,資料面臨的挑戰反而更大,對統計學的底子要更深刻熟練才能把控好大資料的精確度和質量,更大地實現大資料的價值。抽樣技術不可能被丟棄,由於混雜性,大資料和真正的總體是有差距的,而且由於規模太大容易出現滾雪球式誤差擴大;因果關係也不會out,因為相關關係有時只是表面現象,因果研究才能發現本質,判斷其意義。

當然,大資料也不會悲觀地淪為軟泡沫,只要統計這個經濟基礎能及時跟上大資料這個上層建築,並且計算機技術能更精準地實現,大資料會發展得更穩更高。哈哈哈,還是好好學習吧,基礎是不會被丟棄的,基礎只會被發展,而且不學基礎也不能無根發芽的。

2樓:徐某某

可以參考一下這篇文章,關於大資料時代統計學發展的若干問題,寫得不錯https://

3樓:易小華

大資料是由平台,資料,演算法,系統,產品幾個層面的技術構成的乙個有機體,是隨著資訊時代不斷深入而產生的乙個新概念。

統計學是基於資料進行分析的學科,歷史非常悠久,比大資料的出現久多了,大資料在演算法層面會借鑑統計學裡面的很多知識,比如:分布,期望,方差,大數定理等等,但是統計學裡面的很多概念和技術應該在大資料時代慢慢會變得不適用,比如抽樣和基於抽樣的統計分析等等,但是統計學應該在大資料時代肯定會有新的發展。比如全量多維度收集資料的可能性,PB級資料分析的可能性等

4樓:Vampire王爵

大資料是乙個新的學科,大資料與統計學的相似處是對資料的研究,大資料和統計學的研究方法和工具不同,或者說是軟體和演算法不同。

5樓:雨落風

統計學本科授理學學士,博士根據方向可以授經濟學博士或理學博士;大資料技術授什麼學位我不清楚。

統計學的乙個定義是:通過收集資料、分析資料來認識未知現象的一門科學。

統計學注重於方法在理論上的研究,而大資料技術似乎更注重方法在計算機上的實現。

二者的關係的話,統計學是大資料技術的理論基礎之一,二者有交集,但不互相包含。

統計學可以看成是一門學問,理論上有很大的發展空間,比如高維資料分析,非引數統計等等,其理論是通過數學嚴格推導出來的;大資料技術更像是乙個工具,可以用在金融、保險、人工智慧、營銷等方方面面。

乙個不太恰當的比喻:統計學是經濟基礎,大資料是上層建築。經濟基礎決定上層建築。

(統計學導論第一節課老師就講了統計學和大資料的區別,可惜忘記了)

6樓:

從字面的意思來看,統計學是一門與數理統計有關的學科,它界定的是範疇規則還有應用領域,類似於乙個基礎學科。

大資料,就當下日常提及的概念,被廣泛應用於網際網路相關的行業,通過網際網路裝置採集的海量資料,並基於海量資料研究的新興業務,類似於應用於實際市場的工具。

這兩者的側重,統計學是定義規則的基礎學科,某種意義上它是相對靜態的。

大資料會根據技術的不斷發展推演出不同的分析模型,並以此來解決不同的問題。相對而言,它是動態發展的。

7樓:自由自在走一生

統計學裡重要的內容是抽樣,用很小一部分的抽樣結果就能判斷整體情況。比如說,調查選舉和政策的支援率之類的,事實證明不準確的時候很多。

當大資料的技術支援全樣本分析後,統計學裡這部分內容就死翹翹了。

8樓:西部騷大叔

關於這個問題我也深深的思考了下!也聽取了很多高人的意見。第一我想說的是統計是一門很特別的學科,統計既是科學也是技術。

大學裡有門課叫做概率與數理統計,概率就是一門科學,統計是建立在概率的基礎上的,沒有概率科學基礎統計的一系列技術就等於零。在回到我們的大資料來說,也必然建立與科學的基礎上,所以統計和大資料都是有一樣的科學基礎。第二兩者有什麼不同?

我們統計有句話叫做「all model is wrong」為啥?統計推斷的基礎建立於分布假設上,但實際情況是複雜的,多變的你能說你的假設全部對嗎?顯然不能。

然而樣本量大對統計推斷的準確性有很大作用,大資料就是這樣的技術,提高樣本量的技術。在整個概率空間中樣本量的提公升無疑是讓你做的模型無限逼近於母集團的分布,這當然比我們隨機抽樣的方式可靠得多,特別是生成學習。第三,在什麼地方用統計?

在什麼地方用大資料,個人以為最主要的取決於,risk tolerance。比如QA,QC你能用大資料,但是統計更加可靠,你不可能對所有產品進行普查那樣耗時耗力耗成本,再比如說藥物統計,DOE,這些全是專業的統計學家幹的為啥因為成本,人力和時間的考慮,更因為risk tolerance的評估。你可以用大資料演算法來進行廣告精準投放,但永遠不會用來進行整個國家的計量經濟做經濟政策,這也是因為risk tolerance。

從基本上來講,從科學上來講,人永遠無法得知整個概率空間,整個樣本空間。也就是大omega。就像貝葉斯一樣他一生都在證明有知道整個概率空間的上帝存在,但是卻附帶發明了貝葉斯思想。

所以人的經驗也被可以用來加入統計推斷技術,這樣反應了人作為自然界的觀察者於受益者必然也要考慮到risk tolerance,因為人不是上帝。

9樓:supersarah

統計學偏向理論

大資料偏向於時髦+應用

某些大學在本科開設『大資料』專業,我看開這個專業的學校,大概是不再把自己當『大學』看待了吧。

大學不是職業技術學院,大學也不是廣告牌。

如果大學的某些領導沒有願望、信心、能力去辦好大學,他應該向組織上申請,調整到職業技術學院任職。

不是在 diss 大資料技術,碩士研究生的研究方向可以有,博士也可以,本科生不行

本科階段開設弦論、量子場論等專業(注意是專業,不是課程)的,也一樣,看起來更像克萊登大學。

10樓:思未央

個人覺得統計學是大資料的理論基礎,簡單來說:統計學+統計軟體=大資料分析,統計學是理論知識層面,而大資料是理論+實際操作。以上僅為個人看法。

11樓:魚千韌

統計學是大資料技術的基礎,範圍廣,在很多學科都能用到,我做資料探勘的時候利用的都是統計學的原理和基本知識,但是資訊時代對大資料人才的需求感覺更大些。

大資料時代,統計學方法有多大的效果?

xj ken 在如今資訊量超載 學習無法根據變化的資訊化時代,大資料 人工智慧得以快速發展。作為個人學會簡單的統計方法,無論是在生活中,還是工作上,都會帶來無與倫比的優勢。我結合對一次初創專案分類統計的研究,作一次小白級的 排序統計 測試。原文如下 通過BetaList分析近年的創業專案分類風向標 ...

心理統計學與教育統計學有什麼區別嗎,學習實驗心理學之前必須先學心統嗎?

起個名可真難 核心內容上基本上沒什麼區別,都是介紹常用的描述統計量及其計算和常用的推斷統計方法。雖說實驗心理學的核心是實驗設計,但任何量化研究的資料分析都需要借助一定的統計分析方法,因此先學習統計再去學習實驗心理學有助於快速掌握不同實驗設計所得資料適用的統計分析方法。 又不是這樣 教育統計學和心理統...

資料科學(data science)和統計學(statistics)有什麼區別?為什麼分成兩個專業?

豆子 資料科學和統計關係和緊密,但各有各的側重點。資料科學是相對比較新的一門學科。字面來理解,會更側重資料 data 以及對資料的處理和分析。因為計算機處理水平的不斷提高,人類收集和處理資料能力也不斷提高。而且企業和機構發現了資料會給我們很多啟發 能幫我們更好地了解相關產品和趨勢,還能幫助我們做決策...