方差公式中 x ux 為什麼要取平方,不取不也能算出資料偏離程度嗎

時間 2021-05-07 03:01:48

1樓:林凌

「方差」的定義就是這樣沒有為什麼,題目想問的大概是為什麼用「方差」衡量離散程度

給x-ux套個絕對值之後其實你愛上多少次方都行,但不同的選擇帶來的是不同的偏向。考慮兩個極端情況:0次方的時候得到的結果表達的是「有多少資料和均值不一樣」,而取∞的時候表達的是「偏離均值最遠的樣本能偏多遠」,這個標準的選擇取決於你到底更在意哪一方面,而二次方這個選擇比較符合通常情況的需求。

此外,方差在做運算的時候具有很多令人愉快的性質,應該也是選用二次方的乙個重要原因

2樓:木木

看了下樓上的回答,明顯更專業。我這就是給初中生的概念。

簡單理解,不代表正確:

1,消除正負偏離差異

例如乙個偏差+1,乙個偏差-1,那麼很顯然這兩個偏離程度是相同的。

所以,我們可以採用「絕對值」或「偶次方」或「絕對值後取任意次方」等等一系列花哨到家的操作,在這些操作下,偏離+3還是-3,它們的輸出值是相等的。

2,體現差異

上文提到+1和-1是一樣的,那麼1個+2和2個+1一樣麼?3個+2和2個+3的偏離程度相同麼?

一樣的話有點違背視覺,那麼如何體現差異性呢?

絕對值無法提現這種差異,二次方可以將偏離「放大」,絕對值後取根號可以將差異「縮小」。我自己個人傾向於1個+2比2個+1大,所以我取二次方。

3.資料計算的簡易性

為啥不取四次方,絕對值後三次方,絕對值後1.5次方……其實吧,大部分現實資料量非常龐大,不是我們初高中的二十個數字逆天,所以要減少工作量,尤其是當年計算機也不太行。主要是乙個簡單樸素的理念。

4.是否有其它合適的公式?

一,方差確實有問題。例如,兩個異常資料乙個3和1個4,竟然和1個5等價。可問題它倆誰更穩定?拋開背景空談毫無意義。

二,統計資料的特徵指標有許多,起碼高中就知道中位數和平均數的概念,你看到前段日子公布的國民人均可支配收入就知道為啥我感覺自己還可以但怎麼給國家拖後腿了;亦或者是前幾天的男女司機事故率比例差的離譜。所以,評判資料,只看乙個指標是容易得到不實的結論的。所以,方差也只是乙個參考量,只要大方向沒錯,沒必要太過糾結指數是否該改為e或者π,甚至更換為指數函式對數函式等顯得更加高大上。

三,除了方差,平均數,中位數,標準差,還有哪些特徵值?我也不知道,畢竟我的數學水平滯留在高中普通學生十幾年了……

3樓:ivy zheng

如果不取平方,很顯然有 ,即所有偏差都是0。因為資料肯定分布在均值兩側,兩側偏差正負恰好中和掉了,因此總偏差是0。

要考慮資料偏差,最直觀的方式是取絕對值,這樣就都是偏離中心的距離,這樣肯定能表達資料偏離程度。

但是絕對值的數學性質不好,存在不可導點。很多需要計算極值的情況,函式設計都是用平方代替絕對值,是因為平方和絕對值雖然函式不同,但極值點是完全一致的。所以,用平方代替絕對值就比較容易理解了。

4樓:只是個正態

第一,書中提到了,沒有平方,任何分布的一階中心距都是0,這個很顯然。

第二,第二,取絕對值的話,沒有平方容易計算。

第三,這麼說,偶次方都可以,但是2次方肯定最好算。

最後,一般只有在均值相同的時候才會用方差估計,更一般情況下用的是變異係數,取標準差/均值,消除比較兩個不同分布時,量綱和均值不同大小的影響。

5樓:SuperMHP

舉個例子,資料[0,1,0,-1],方差是0.5。不取平方算平均差異的話是0。

方差之所以稱為統計特徵,就是因為它可以反應一組資料的某些性質。而你說的不取平方的運算元並不可以,它確實可以反應單個樣本遠離均值的程度,但是它不可以反應一組資料平均的離群程度。而實際應用背景下,我們關注的往往是後者,而非前者。

6樓:LG.ANIHC

從幾何意義上來看可能會更好理解一些,偏離程度指偏離均值的距離多少。而且我記得最後算的是平方和不平方累加可能會出現正負抵消的情況。

為什麼自然科學裡很多公式符合平方反比定律,為什麼指數是 2 不是 3?

煙雨江南 你講的很有道理,愛因斯坦也沒有錯。世界很多就是殊途同歸。因能生果,也能生因 推導 老子雲,宇宙世界負陰而抱陽,陰陽是相互轉化和聯絡的!在宇宙層面上是可以理解的! 自學生 都是一對正反比和正中平衡統一時間標準的數學原理模型。1半 1對 3的三方統一標準的二分之一 的內外前後上下正中統一時間標...

為什麼使用樣本估計方差要除自由度呢?

靜學社 學無止境 估計總體引數有 矩估計法 最大似然法 貝葉斯法 和 自助法 等。矩估計法 估計總體方差得出的結果是樣本離差平方和除以n,但是發現除以n有偏,而除以n 1則無偏,所以一般用的是除以n 1。如果樣本容量最夠大,那麼除以n還是n 1沒有什麼差別,你高興用哪個都行,小樣本則建議使用除以n ...

最優指標中為什麼要有控制量的平方?

為什麼要有控制量?不清楚這裡的Delta u代表控制量和參考值的差還是控制量的變化量。假設是第一種,比如送火箭上天,控制量就是燃料加多少,當然是希望越少越好了。還有就是控制量也需要到達某一設定值,比如化工過程停留在某乙個穩態時經濟效益最佳,那麼這個穩態對應的控制量就是設定值。假如是控制量的變化量,有...