如何理解統計學中 自由度 這個概念?

時間 2021-05-09 19:07:24

1樓:zzzz

最近在學計量的時候遇到了這個問題,覺得大多回答過於高深,特別是關於用樣本方差估計總體反差這個例子(如下)

這裡的疑惑很明顯,我還沒有取最後乙個x,怎麼樣本的均值他就固定了呢,真的很莫名其妙,於是有了第二種思路

當然初次看到還是會有些懵逼,結合這個回答會明朗一些,為了方便放了前輩回答的截圖,回答鏈結見下文

摘自(https://www.

2樓:

自由度說白了就是真實未知量的個數。

比如a+b=0. 看上去有兩個未知量實際上a=-b b是可以通過a得到的。本質上只有乙個未知量。所以自由度是1.

其實和矩陣的秩是乙個道理。為什麼有的矩陣不滿秩和為什麼自由度不是n 本質上是乙個問題。

3樓:小鹿孩思婉

我是這麼理解的,假如13579五個數的均值是5,那麼如果我要把數字換了,比如前面四個數我換成了2468,那麼為了保持均值不變,剩下的乙個數就不能自由取值,比如剛剛2468,如果想保持均值不變,那最後乙個數就一定是5,這個5就是確定的,而前面四個數可以任意取值,這裡可以認為這就是自由度

4樓:TengZy

我認為,自由度可以理解為不受約束的程度。類似於樓上所述的解釋線性未知數的觀點。

我們假設有N個觀測值,假入不加任何形式的約束,那麼這N個觀測值可以XJB搞,隨意打哪。

但是,現在新增乙個約束條件,N個觀測值中的某乙個數為100,那麼,接下來可以XJB搞的N的個數就只有N-1個了。

同理,如果約束條件增加,那麼相應地自由度也會對應減少。

但是,約束條件個人覺得應該是確定性條件,否則的話,例如N滿足N>100,實際上還是有N個數可以XJB搞。

5樓:

最高贊回答的很好,我補充乙個更一般性的結論:

Degree of freedom = 隨機變數的個數。

在隨機變數x1,....,xn,只要某兩個隨機變數能夠構建關係(構建方程組),就能讓它們減少乙個自由度。因為他們有correlation,他們構成的design matrix就不滿秩。

舉個例子,x1^2 + x2=1 就可以減少乙個自由度。因為x1固定,x2也不得不固定。

6樓:Merlin

首先,我們需要確定計算樣本方差(統計量)是為了估計總體方差(總體引數),使用n-1的原因就是為了保證 是 的無偏估計量,即 。通過驗證,可以知道使用n-1時 確實是 的無偏估計(馬後炮),但是我們也可以從下面這個角度來分析。

在已知 的情況下, 的乙個估計量就是 ,但一般情況下無法知道總體均值 ,因此只能使用樣本均值替代,要使用樣本均值,就必須滿足乙個條件: ,給定n個觀測值,在滿足上述條件的情況下,就只有n-1個觀測值是自由的(可以隨意變化),因此也稱n-1為自由度。這時,就可以使用估計量 來對總體引數 進行無偏估計了。

*從這個意義上說,-1就是為了滿足上述的約束條件*。

另外乙個有關自由度的例子在洪永淼教授的著作《概率論與數理統計》p259頁中有敘述,現摘錄如下:

7樓:企研資料

在統計與計量經濟學中,一旦涉及到方差統計量以及某些檢驗統計量(如t統計量、F統計量、卡方統計量),通常會出現自由度概念。就應用而言,如果只是利用相關公式,那麼自由度及其調整屬於細節問題。但我們一般不願意機械地利用相關公式,而是希望理解其背後的邏輯。

不幸的是,就理解而言,自由度及其調整應該稱得上是乙個「硬核」問題。

很多同學對自由度及其調整感到困惑,而學生時代的兩位作者其實也在這些同學之列。究其原因,主要應歸因於教科書——很遺憾,就我們所翻閱過的本科層次教科書而言,還沒有發現任何一本書曾專門詳細地講解過相關的內容。鑑於此,我們基於自己對這個主題的一些理解,不揣淺陋寫下了一則筆記。

根據我們求學時的經驗,教科書(或者老師)經常在學生們容易明白的地方嘮叨,卻總會在學生們難以明白的地方一帶而過。

當然,這或許屬於記憶偏差,畢竟「在難以明白的地方一帶而過」讓人記憶深刻;我們也可能誤讀了其中的因果關係——可能正是因為嘮叨才讓學生們明白,而不是學生們早已明白。但無論如何,我們在此敢保證,同學們對自由度及其調整感到困惑,而教科書或者老師卻對此吝於回應,的確屬於真實情況。我們希望此則筆記能夠對同學們有所啟發!

網頁鏈結

8樓:塗開心

有些答案太難了原諒我看不懂

我的理解是這樣的

1.總體中每個個體是隨機的總體數量為n ,則自由度為n2.樣本是抽出來的,總體為n 樣本為T 假如樣本量T=10 分別是 1 2 3 4 5 6 7 8 9 10 那麼(yt–E(y))^2中 E(y)是確定的,但是yt是變化的可能是1可能是2 ......

當確定了9個最後乙個也就知道了所以自由度為T–1

9樓:趙俊雄

簡單來說:

計算標準差的時候,除了需要n個樣本之外,還需要n個樣本的平均值。

而當已知n個樣本的平均值以後,這n個樣本中,只有n-1個可以隨意自由取值,剩下的最後乙個可以根據n-1個樣本的具體資訊和樣本平均值的資訊來推導或確定下來。

正如有答案所說,自由度,就是自由的維度,已知了樣本平均值,那麼自由的維度就減少乙個,相當於多了乙個限定或者說約束條件

10樓:Laplace

統計學專業的來答一發。關於自由度的解釋上面都很多了。關於計算標準差的時候除以n還是n-1,這個其實是看需要,如果需要的是無偏估計就除以n-1,至於為什麼,這是數學上可以證明的(根據無偏估計的定理可得到);如果除以的是n,則得到有偏估計;但是:

不是在所有情況下,無偏估計都優於有偏估計。

11樓:顧鵬

有乙個解釋不知道是否能夠幫助你:

如果你只有乙個樣本,跟據非修正的公式,計算方差為0,但是你會相信這個數值嗎?

這兩者的區別在於,你也在對均值進行估算,所以資料中實際n-1個資料是有意義的,剩下乙個只是為了計算均值。

本質上,這是自由度的「簡單」理解。

12樓:

這裡Crash Course Statistics的老師講得很好。因為這是最近的課程,B站還沒有熟肉,就扔乙個原鏈結上來了。

13樓:李耳總

問題1.

自由度是表達統計量的變數維度數。

問題2.

樣本方差是總體方差的無偏統計量時,分子中選樣本均值,因樣本均值占用乙個自由度,分母中取(n-1)

極端情況:樣本量為1,此時樣本方差不能估計總體方差,對應分母為0

14樓:

首先是自由度這個概念,專業的概念已經都解釋了,下面我說一說自己膚淺的理解:

就比如y=x1+x2中x1和x2是可以自由變化的量,會影響總體的值得改變,但是兩者之間互不影響。

在下式中,

Xi之間可以自由變化而互不干擾,你變你的我變我的,井水不犯河水。

而在下式中,

看似有n個Xi還多了乙個 ,好像有n+1個量,實則不然,因為 是Xi的均值,可由他們線性表示,而這n個Xi之間看似互不相干,實則好像確實也這樣,但是由他們所線性組合而成的n個式子之間卻存在這線性相關,即,

即在n個Yi中,可自由變化的只有n-1個,倘若先取前n-1個,那麼最後乙個Yn也就唯一的確定了,只能是-(Yi+Y2+...+Yn-1),而這減的1可視為總和為0的乙個制約關係。也可以結合線性代數的知識視A[X]=Y,而A的矩陣的秩並不為n而是n-1,X經過A變換之後雖然維數仍為n維,但是他喵的竟然降了一秩,其中A的第一行大概如((n-1)/n 1/n 1/n ...

1/n),第二行大概如( 1/n (n-1)/n 1/n ... 1/n)依次等等。

舉個例子比如說X1是桃子、X2是梨子,X3是蘋果,而我,也就是Y1有a個桃子,b個梨子,c個蘋果,而你,有2*a個桃子,2*b個梨子,2*c個蘋果。那麼問題來了,我們一共有多少水果?

欸~本來自由量分別是桃子、梨子、蘋果、經過分配這一線性變換之後,就變成了我和你這兩個量,換了乙個基,不過這時候的自由量不再是3而是變成了1了,很僵!為什麼呢?無論我的各水果數量如何變化,你的都是我的兩倍,可以由我線性表示,所以此時若我=a*桃子+b*梨子+c*蘋果,而你=2*我,所以在咱們兩個所組成的資訊中,我就是自由量了,當然你也可算作自由量,這時我=1/2*你。

維基百科上關於自由度的說法是:

數學上,自由度是乙個隨機向量的維度數,也就是乙個向量能被完整描述所需的最少單位向量數

對比自由度的定義就是總的水果是乙個向量,你和我的水果都是單位向量,但是你我之間可以相互表示,所以在描述總水果數時只需你我乙個就夠了,也就是自由度為1,如總=3*我,或總=3/2*你。注意:這裡的a、b、c應當視為整體(a b c)而不是三個單獨的量。

這時候還不理解的同學可能想,欸你有你的水果,我有我的水果,怎麼就不算兩個自由量呢?理由就是,如果你變了,我也得變;反之我變了,你也得變,這不符合自由量中兩者之間互不影響的定義,換句話說,就是咱們所擁有的水果的關係已經被你=2*我這一等式制約了,極端不恰當的說法就是「你的就是我的,我的就是你的」。

話說回來,明白自由度為何為n-1之後,為何服從自由度為n-1的卡方分布,則可以通過矩陣正交變換的知識將Yi等價的變換到n-1個服從正態分佈的Zi的量,另外乙個被變換到0(貌似是。。。).因而完畢。

主要參考 @yiyuezhuo

15樓:吳浩

「自由自由度」這個詞有些怪誕,但卻可根據下述理由想象。

平均數的 SE依賴於測量值的SD,而SD又反過來依賴於距離平均數的偏差。而偏差之和必須為零,因而它們不能都自由變動。於是和為零的限制消除乙個自由度。

16樓:Array

簡單點說,

自由度=觀測的數目 - 這些觀測中存在必要的聯絡數目

舉例:multiple linear regression的自由度 = n(觀測數目)- k (predictors,理解為relations的數目)- 1(intercept也是一種relation)

17樓:Jacob

答主資質有限,僅供參考。

乙個隨機變數的方差描述它的離散程度,理論上應該是n個隨機變數對均值離散程度的平均值.

其中我們本來按照定義,要用樣本值減去總體均值刻度第i個樣本的離散程度.但是由於總體均值並不可知,所以只能用其估計值代替,認為就是總體均值.

因此,在這裡就不是乙個隨機變數.我們知道的無偏估計應該是,

這時候,當x1,x2,...,xn1抽樣確定下來時,xn,為了滿足上式,實際上也確定了下來:

所以xn在觀測前就確定了下來.所以在這裡,我們雖然希望得到隨機變數的方差,但是在樣本量為n的抽樣中我們只得到了n 1的隨機變數,最後乙個變數則是確定的.這時候我們稱有n 1個自由變動的隨機變數,也就是自由度:

the number of degrees of

freedom is the number of values in the final calculation of a statistic that

are free to vary.(wikipedia)

根據定義,方差計算的是隨機變數的離散程度(用離差平方和測量)的均值,實際上有n 1個隨機變數.所以樣本方差應該調整為:

對於線性回歸模型

每乙個觀測值i可以列出乙個樣本回歸方程.我們知道,這裡有三個未知引數,三個樣本可以把它們唯一地確定下來.

(1)雖然β是未知引數,而樣本似乎是確定下來計算β的,但是在總體模型中,它卻是確定的,樣本則是隨機的.這種情況下上式的解釋就要掉過頭來,是有3個確定性的變數β0,β1,β2,用它們來確定了3個樣本值.而β則是樣本的乙個函式,作為總體β的估計量, = f(xij) ,一如Var(x)

= f(xi) .利用n個樣本值計算,與上文分析方差的論述同理,有3個樣本實際上是確定性的,見(1)式.因而真正參與計算的隨機變數只用n 3個.所以我們稱自由度為3.

最後,行文上的不嚴謹性,請見諒並批評.

物理中自由度怎麼理解?平動,轉動,振動的自由度,還有剛體的自由度?

完全描述乙個物體位置狀態的變數的數目,是物體的自由度。在拉格朗日或者哈密頓力學中,你知道了這些變數的數目,再加上這些變數的耦合變數 動量,或者速度,幾何意義有些許不同 就能完整描述這個力學體系的含時演化 當然你要把相互作用的形式寫出來,例如體系的能量等 翁鸌 直白一點,玩射擊遊戲,wasd控制這水平...

如何理解 自由度凍結 現象?

對於理想氣體分子,有熱運動的平動動能 轉動動能 振動動能和振動勢能 根據能量均分定理,可以得到 從上面的式子我們就可以看出每一分子的每一平動或者轉動的自由度對熱容的貢獻為 每一分子的每一振動自由度提供的熱容為 系統中存在 個分子,從而還要再乘上 某一分子的某一自由度被 凍結 那麼這一分子的這個自由度...

如何理解並區分統計學中percentile,quantile,quartile的概念?

冰水一杯 分位數 quantile 把一組按照公升序排列的資料分割成n個等份區間並產生n 1個等分點後每個等分點所對應的資料。按照公升序排列稱作第一至第n 1的n分位數。注 如果等分點在其左右兩個資料的中間,那麼該等分點所對應的數就是其左右兩數的平均數 確定等分位點位置的其中一種常用公式 n 1 p...