在統計學裡,假設檢驗中的power 和size分別有什麼什麼含義?

時間 2021-05-12 02:26:16

1樓:刻舟求劍Keh

菜雞寫給自己看,基礎概念理一理思路。

首先在假設檢驗中,我們一般認為H1是我們更感興趣的情況,比如,我們一般會將: 無異常定為H0,將有異常定為H1。將某個因素無影響定為H0,有影響定為H1。

將我們預期的情況定為H0,將其他未知的情況定為H1。

Power是1-P(no reject H0 | H1)。

舉例:y=x1b1+x2b2

我們檢驗:H_0: b1=0,H_1: b1!=0

Power高意味著如果真實的b1不為零,那麼我們的檢驗可以敏銳的識別出來它。直觀上意味著,我們構建的檢驗是有用的,是powerful的。

Size是1 - P(no reject H0 | H0)。

Size衡量的是,False Discovery的概率。也即,如果我們的真實資料是H0下產生的,較高的size說明我們的檢驗會有很大概率誤以為資料是H1下生成的。

在實際中,我們往往會對統計量T選擇某乙個thrshold,來進行判斷,也即如果|T|>c 我們拒絕原假設,反之則接受。所以實際上在給定樣本的時候,Power和Size存在乙個tradeoff。對c進行調整,並不能夠同時提公升Power和Size,做到想要什麼結果就有什麼結果。

Power和size的定義實際上依賴於我們對於統計量的threshold的選擇。所以在理論研究的時候,我們會更在意T的分布,至於具體怎麼去權衡,選擇c,就看實際問題的需求。

對分布的研究主要是用local althernative的框架。

直觀來說,local althernative是指,我們希望隨著樣本的上公升,我們的檢驗統計量,能夠區分H0和H1之間的更加細微的差距。

那麼對這個「細微程度」進行定量的刻畫,我們可以定義不同的速度,我們可以在理論上對不同檢驗統計量的分布性質給出更好的描述(相對Power和size而言)。

比如,統計量一,可以區分 H0:b1=0, H1: b1 = C*1/n

統計量二,可以區分 H0:b1=0, H1: b1 = C*1/n^2

那麼我們認為統計量二相對來說有更快的速度,能夠提供乙個理論上更優秀的檢驗結果。

聽說生物統計的文章會更傾向於對power和size進行分析,這就需要專業人士來解答了。

2樓:Klarissa Mendoza

power也叫statistical power(統計功效),是統計不犯Type II錯誤的能力。而Type II錯誤也就是我們通常說的false-negative rate,也就是乙個東西明明是與原假設有顯著區別的,你非說沒啥區別。

一般而言,在做AB測試時,允許20%的false-negative rate,也就是power要至少80%。

對於你提到的size,主要是根據你的power和最小觀測值MDE(minimum detectable effect)和你的限制性p值一同決定的。

舉個例子,我知道了我的測試要90%顯著,需要80%的power,然後我想要0.1%的MDE,也就是AB組兩個分布至少平均要差0.1%,我才認可他們有差距。

最後得出了每乙個版本至少需要18,000個樣本。這裡的樣本就是size。

3樓:lakyblu

對於同乙個檢驗,size和power是tradeoff的,不可兼得。對某個假設的兩個不同test進行比較時,在相同的size下,power越高越好。常說某個test的power低,是指在control 5% size時,test過於保守,經常不能拒絕原假設。

統計學假設檢驗中為什麼P值越小,拒絕原假設的理由就越充分?

齊天大聖 P值的含義 原假設成立的情況下,發生與樣本相同或者更誇張的情況的概率。人話 拋硬幣,樣本是拋10次,有6次正面。P 值就是拋10次,有6 7 8 9,10次正面朝上的概率之和。P 值小於0.05 規定 即允許犯第一類錯誤概率 為小概率事件 即根本不會發生 但是原假設竟然認為他發生了,說明啥...

統計學假設檢驗中 p 值的含義具體是什麼?

SoTimeWillTell P value 是根據我已經認同H0的條件下進行計算的 比如,我認為有一班人平均體重是50公斤。我揪出來了一撮人,平均體重是個200公斤。按照已知平均班裡體重50公斤的情況下進行計算。我揪出來這一撮人平均體重是個超過200公斤的概率是個0.0001,這計算出來的概率就是...

在統計學中,假設檢驗中的顯著性水平的意義是什麼?

siyan 顯著性的含義是指兩個群體的態度之間的任何差異是由於系統因素而不是偶然因素的影響。我們假定控制了可能影響兩個群體之間差異的所有其他因素,因此,餘下的解釋就是我們所推斷的因素,而這個因素不能夠100 保證,所以有一定的概率值,叫顯著性水平 Significant level tomK 這個可...