有了方差為什麼需要標準差?

時間 2021-05-09 19:07:24

1樓:Joie FRM

簡單的說,為了量綱的統一。(貌似之前有知友說過這個問題,我再來敲一下黑板)

舉例來講,如果要統計10個人身高的均值和方差,得出的均值可能是x =1.6公尺,方差會怎麼算呢?

演算法大家都會,那麼請問一下,方差的單位應該是什麼呢?由於所有的身高都被加了平方,因此方差的單位將是公尺。

有的朋友可能認為這也沒什麼大不了,公尺就公尺唄,可是方差存在目的是為衡量一組變數的離散程度,說的再直白點就是一組變數距離均值的離散程度,因此本質上是要以均值為中心,用方差衡量變數到均值距離的遠近。然後由於單位不同(量綱不同),沒有辦法直接相加減,標準差就可以解決這個問題。

有了標準差之後,我們就可以更方便的描述乙個變數的離散程度,假如上面這10個人算出來的標準差是0.2公尺,那麼1,64公尺就可以表述為超過均值兩倍標準差。這個特徵帶來的便利性在連續變數的概率分布中非常顯著。

比如標準正態分佈,我們就可以說,均值左右1.645倍標準差,可以涵蓋90%的概率。

另外還有乙個概念叫做平均差,它的計算方式是對(X-x )取絕對值,這樣雖然與均值保持了量綱的一致,但會導致平均值的不連續性,不連續也絕對不是數學家們所喜歡的,而且用計算器處理絕對值問題也比較麻煩。

2樓:

標準差是以與原始資料相同單位來度量的,因為這個原因,標準差更易於和單位也與原始資料相同的均值等其他統計量進行比較。

例:畢業生起薪資料的樣本方差 S=10000(人民幣) ;標準差 S=100 (人民幣)

3樓:馮春明

為什麼需要標準差呢?

比如乙個班的成績服從正態分佈N(60, 10^2)10^2=100是方差,你怎麼來描述這個班的成績情況,這樣描述:

這個班的平均成績是60分,全班同學的成績與60分差的平方的均值為100

這有點「脫褲放屁」之嫌!!!

引入標準差10之後就可以這樣描述了:

這個班的平均成績是60分,全班同學的成績與60的平均差距在10分左右。

4樓:SHAWN

什麼是方差?

方差是用來衡量資料離散程度的乙個統計值,計算公式:

可以看出,方差的計算使用了資料集的所有數值,而不只是個別極值(如極大值和極小值),因此方差可以很好的反映資料的整體離散程度。

從公式理解,方差是資料偏離平均值距離的平方的平均值可為什麼是偏離平均值距離的平方的平均值,而不是偏離平均值距離的平均值呢?直覺上後者更容易理解才對。

完全正確,因此就有了標準差,對方差取平方根就得到了標準差,它同樣反映資料的離散程度,但因為它跟原始資料為同乙個量綱,更加符合我們的直覺,也更方便解釋。

例如我們可以說小明比全班平均身高高 (標準差),但不能說小明比全班身高高 (方差)。

以上即方差和標準差的聯絡和區別。

5樓:龐興沛

我了解的大概是,統計學中為了度量隨機變數的離散程度,最簡單有效的辦法就是觀察每個樣本到均值的距離,這些距離求和再取平均值。

這個距離最直觀的取法就是取兩個點之間的直線距離,也就是|Xi-E(X)|。問題是數學上不方便處理絕對值,就用數學上更方便處理的辦法--開平方來消掉負號。所以最後樣本到均值的距離統一採用(Xi-E(X))^2來計算,距離求和後除以樣本數就是方差了。

方差因為具有一些優良的數學性質,成為刻畫散布度的最重要的數字特徵之一。

不過方差因為開平方,度量單位和樣本的單位不一致,標準差的好處是通過開根號讓兩者的單位一致。

6樓:fenury

我覺得題主的意思是為什麼N會有個根號,這個根號的存在影響了對平均的含義的理解。將方差開根號,確實可以使數字單位統一,這可以理解,但是對N開根號,意義何在,我在學習統計學的過程中也卡在這個問題上,望高人指點。

7樓:黃聖

方差利用了所有觀察值的資訊描述變數的變異程度,但是方差的量綱是原變數量綱的平方。來自統計書。所以標準差有它存在的價值。t

8樓:TomHall

標準差和均值的量綱(單位)是一致的,在描述乙個波動範圍時標準差比方差更方便。

比如乙個班男生的平均身高是170cm,標準差是10cm,那麼方差就是100cm^2。可以進行的比較簡便的描述是本班男生身高分布是170±10cm,方差就無法做到這點。

再舉個例子,從正態分佈中抽出的乙個樣本落在[μ-3σ, μ+3σ]這個範圍內的概率是99.7%,也可以稱為「正負3個標準差」。如果沒有標準差這個概念,我們使用方差來描述這個範圍就略微繞了一點。

萬一這個分布是有實際背景的,這個範圍描述還要加上乙個單位,這時候為了方便,人們就自然而然地將這個量單獨提取出來了。

為什麼說方差是沒有量綱的而標準差是有量綱的?

Var沒有量綱是因為二階中心矩能夠起到乙個類似於歸一化的作用,消除了不同變數間量綱不一致的情況 變異係數 STD E X STD的量綱和E X 的量綱一致,所以變異係數是乙個無量綱的量 這裡所說的量綱應該指的是我們日常說的類似於 公尺,公斤,毫公升 一類的 單位 吧。那麼暫且這麼來理解 量綱 的意思...

標準差相同,為什麼平均值小的離散程度大?

路人乙小明 我覺得這裡面最重要的還是0是否有意義 比如2,3,4度和52,53,54度你覺得哪個變異大呢?真的是2,3,4度大麼?如果我們以絕對零度為0,那現在這兩組資料你還會覺得變異程度差距很大麼 我覺得比較好理解的乙個特性就是標準差與均值的比比較大的時候,容易出現小於0的值 離散係數的出現是因為...

統計學上標準差與標準誤的區別與聯絡是什麼?

廿一 我來了。我不請自來。專業我可能做不到,但是淺顯易懂明顯是我的強項嘻嘻。定義我就不上了,能提出這個問題或者看到這個問題的朋友肯定是看過定義的。標準差和標準誤二者分開學的話,應該問題不大。我每次學統計 對我學了很多次 看到標準差或者標準誤都秒理解。但是有時候這倆兄弟一起出現,我就 感謝Alisa提...