- 文章
- 最新
統計功效——生物醫學實驗知識要點

統計功效不足是致使生物醫學類研究質量低下的關鍵原因之一。[1]包括《試驗報告統一標準》(Consolidated Standards of Reporting Trials, or CONSORT)[2]在內的一眾寫作規范均要求作者驗證其樣本量的合理性。《英國外科學雜志》(British Journal of Surgery)[3]?及《美國醫學會神經病學雜志》(JAMA Neurology)[4]?則規定作者在稿件中展示功效計算過程。還有一些出版物,如《分子遺傳學與代謝》(Molecular Genetics and Metabolism),更是明確表示“對于未含功效計算的稿件,將不予評估,直接退稿”。[5]?對統計功效有著嚴格要求的不止醫學和生命科學,美國心理學會在其《心理學研究報告準則》(Reporting Standards for Research in Psychology)[6]中,同樣強烈建議論文作者在方法章節給出功效分析。
什么是統計功效
在統計學中,功效指在檢驗假設中,拒絕原假設后,正確替換假設被接受的概率。統計功效不足的研究,往往會無法識別出重大發現或得出假陽性結果。進而令數據的一致性存疑,且具誤導性,最終動搖研究信度。[7]
如何計算統計功效
在設計實驗時,需要考慮以下四個要素:
一:樣本量,即抽取的樣本元素(如患者)總數,通常以N來表示。
二:效應量。通常來說,效應量越大,所需樣本量越小。
三:α水平,即顯著性闕值(通常是.001,.05 或 .1)。若p值達到或高于α水平,則研究結果在統計學上不顯著。
四:功效。代表發現效應的可能性,為數值。
上述四個參數相互關聯。當掌握了其中三個參數的值,便可得出第四個參數。如上文所說,通常α水平是固定的。而在查閱文獻中也可大致了解效應的大小。所以,若想讓研究具有較大的功效,就需要關注樣本量。
本文并未提及研究方法,因為研究功效與其方法無關。一些研究本身的統計功效較小,卻不妨礙其設計得精密嚴格,許多臨床試驗就是如此。但無視統計功效可能會因樣本量過小而無法識別研究效應,既不能得到有信度、可重復的結果,又浪費了時間和資源。
什么時候計算統計功效
數據收集一旦完成,功效就難以修正了。因此,在實驗設計階段作先驗功效分析就十分必要。如研究屬長期型,可能還需作中期功效計算,以便調整樣本量,避免研究過早結束或不必要地延長。當面對非顯著的研究結果,有時也要作后驗功效分析以進一步查明原因。值得一提的是,功效計算還能為基金申請增色,它能幫助評審人員衡量研究的可行性。
結語
功效分析能幫助研究者回答自己提出的研究問題,自圓其說。而功效值又取決于研究者是否能準確估算所需樣本量。
?
?
參考文獻
[1]?https://royalsocietypublishing.org/doi/10.1098/rsos.160254
[2]?https://www.equator-network.org/reporting-guidelines/consort/
[3]?https://academic.oup.com/bjs/pages/general-instructions
[4]?https://jamanetwork.com/journals/jamaneurology/pages/instructions-for-authors
[5]?https://www.elsevier.com/journals/molecular-genetics-and-metabolism/1096-7192/guide-for-authors
[6]?https://www.apa.org/pubs/authors/jars.pdf
[7]?https://web.ma.utexas.edu/users/mks/statmistakes/UnderOverPower.html