小資料和大資料的區別是什麼,有什麼關係?

時間 2021-05-10 21:32:04

1樓:

小資料和大資料不只是大小區別的概念。

大資料偏向於大量客觀事實不涉及個人感受狀態的資料,側重物件的廣度。

小資料偏向於行為資料,社交資料,心理資料,個性化資料,定製性資料,側重物件的深度。

有一本書叫《痛點》比較好得詮釋了什麼叫小資料,可以瀏覽看下。

2樓:

從技術上看,大資料相比於小資料,就是資料量增大了而已。但是當資料量大到一定的程度後,傳統上用來處理小資料的方法就失效了。資料的處理主要包括資料的儲存和計算。

首先是資料的儲存,單機存不下,需要分布式的儲存,這樣的需求催生了HDFS這樣的東西。然後是計算的時間多了,也需要並行地分布式計算,比如MapReduce等。

相比於小資料,大資料的資料量足夠大了。原先的小資料可能並不存在統計規律,那麼資料量大了之後,原先隱藏在資料中的規律、知識、模式就會慢慢地浮現出來,通過機器學習、深度學習等領域裡的一些方法,就可以將其挖掘出來。

3樓:冰封

小資料和大資料的區別是什麼?這個是沒有乙個絕對的概念

曾經參加過交流會議,有些公司幾千萬條的資料也稱為大資料,也用什麼大資料架構,我猜想如果他的架構放到高併發場合可能馬上就蹦了。

可不用糾結什麼大資料或者小資料

我個人認為,從資料分析角度出發,我可以簡單的做出如下判斷,

大資料:資料項和資料量多到你無法用你的肉眼和目前傳統的結構化資料庫來篩選和分析,資料無限在快速增大。

小資料:資料項一眼就看出端倪,簡單的查詢就能快速找到資料,都能估量未來的資料量大小。

大資料和小資料的區別是什麼?

天天 簡單地說,我認為現在所謂的大資料新聞更像是乙個遙不可及期望達到的概念,真正的大資料新聞幾乎沒有吧。因為在新聞製作中,資料的量級就難以達到大資料這個概念。投入的成本太高,只為新聞而做的話,幾乎不可能,所以現在看到的資料新聞其實絕大多數都可以說是題主所稱的 小資料新聞 或者就說是 資料新聞 之所以...

資料科學 大資料 人工智慧 機器學習的區別是什麼?

這是乙個flag 這幾個概念其實是乙個程度深入的問題,資料科學和大資料是基礎,是其他技術發展的根本,沒有這兩者,其他的都是虛空的,而人工智慧與機器學習的關係就更為奇妙了。但是這幾項技術的發展對於這個社會來說終究是有益的,但是也有人懷疑人工智慧的好壞。那麼,人工智慧對於各行業來講,到底是成就還是毀滅呢...

資料科學,資料探勘,資料工程和大資料之間有什麼關係?

淡淡的憂傷 資料探勘和資料科學基本上是一回事。資料探勘是30年前的說法,現在叫法高大上些。以前資料探勘主要是基於統計學的理論和演算法。這幾年理論上,大量用數學和物理的理論和演算法逐步引入,比如流型,熱力熵啊。總的來說這兩個是一回事。資料工程,是具體把資料科學理論去解決實際問題。如同理論核物理和核工程...