行業新聞

P 值用處何在？學術界爭論再起

2017年09月29日 1.4萬 views

P 值廣泛用來指示研究的兩群組間的差異、關系等幾率或變數，傳統上，如果 P 值小于 0.05，研究結果結算具有統計“顯著”。幾個月前，幾位學者發聲認為應該要限制 P 值小于 0.005，預防假陽性結果。這個說法激起了科研界的討論和爭辯，有些學者針對這個提議發表回應，認為要處理 P 值濫用的問題，需要要求科研人員說明他們如何使用 P 值。

最廣泛被討論的問題是可接受的 P 值底線有很大的誤用和錯誤解讀空間。2017 年 7 月，72 位著名的研究人員在 PsyArXiv 預印本伺服器上發表了一篇論文，文中爭論社會科學和生物醫學科學的 P 值是否該將閾值設在 0.005 以下，論文的 lead author 之一同時也是美國南加利福尼亞大學經濟學家的 Daniel Benjamin 說道：「介于 0.05 和 0.005 間的 P 值只能看作是“提示性證據”(suggestive evidence) 而不算既定知識。」

9 月 18 日，另一群學者針對這個想法發表回應。這份立場相反的回應報告第一作者、荷蘭埃因霍芬理工大學 (Eindhoven University of Technology) 實驗心理學家 Daniel Lakens 認為，強行設定 P 值閾值可能會造成更多新問題，例如增加假陰性的數字，如此一來，一個問題的解決辦法又變成另一個新問題的源頭，Laken 還指出另一個可能的“文件抽屜”(file drawer) 問題，很多研究可能會因為陰性結果不被期刊接受而永遠無法發表，他說：「在施行任何政策之前，需要肯定新政策不會造成無意的負面結果。」他提議科研人員應該在收集數據之前，就該選定注冊報告中的 P 值閾值，并解釋如此設定的原因。對 Daniel Lakens 來說，這個做法能讓 P 值的使用更加負責，還能讓使用分析更加簡單。

另一個科研人員面臨的大挑戰是無法重復結果，這也讓 P 值的使用顯得更加重要。有些期刊甚至因為無法復制而做出禁用 P 值這樣極端的決定。目前科研界對 P 值的使用明顯分成兩派，但究竟這個議題最后會達成何種決議，目前還不清楚。

你的研究也有使用 P 值嗎？你對降低閾值有何看法？這會影響你的研究嗎？歡迎評論分享。

意得輯專家視點相關推薦閱讀：

參考資料：