P 值用處何在?學術界爭論再起

P 值用處何在?學術界爭論再起

P 值廣泛用來指示研究的兩群組間的差異、關系等幾率或變數,傳統上,如果 P 值小于 0.05,研究結果結算具有統計“顯著”。幾個月前,幾位學者發聲認為應該要限制 P 值小于 0.005,預防假陽性結果。這個說法激起了科研界的討論和爭辯,有些學者針對這個提議發表回應,認為要處理 P 值濫用的問題,需要要求科研人員說明他們如何使用 P 值。

最廣泛被討論的問題是可接受的 P 值底線有很大的誤用和錯誤解讀空間。2017 年 7 月,72 位著名的研究人員在 PsyArXiv 預印本伺服器上發表了一篇論文,文中爭論社會科學和生物醫學科學的 P 值是否該將閾值設在 0.005 以下,論文的 lead author 之一同時也是美國南加利福尼亞大學經濟學家的 Daniel Benjamin 說道:「介于 0.05 和 0.005 間的 P 值只能看作是“提示性證據”(suggestive evidence) 而不算既定知識。

9 月 18 日,另一群學者針對這個想法發表回應。這份立場相反的回應報告第一作者、荷蘭埃因霍芬理工大學 (Eindhoven University of Technology) 實驗心理學家 Daniel Lakens 認為,強行設定 P 值閾值可能會造成更多新問題,例如增加假陰性的數字,如此一來,一個問題的解決辦法又變成另一個新問題的源頭,Laken 還指出另一個可能的“文件抽屜”(file drawer) 問題,很多研究可能會因為陰性結果不被期刊接受而永遠無法發表,他說:「在施行任何政策之前,需要肯定新政策不會造成無意的負面結果。」他提議科研人員應該在收集數據之前,就該選定注冊報告中的 P 值閾值,并解釋如此設定的原因。對 Daniel Lakens 來說,這個做法能讓 P 值的使用更加負責,還能讓使用分析更加簡單。

另一個科研人員面臨的大挑戰是無法重復結果,這也讓 P 值的使用顯得更加重要。有些期刊甚至因為無法復制而做出禁用 P 值這樣極端的決定。目前科研界對 P 值的使用明顯分成兩派,但究竟這個議題最后會達成何種決議,目前還不清楚。

你的研究也有使用 P 值嗎?你對降低閾值有何看法?這會影響你的研究嗎?歡迎評論分享。

?

意得輯專家視點相關推薦閱讀:

參考資料:

期待學術生涯高歌猛進,發表過程一帆風順?

來加入我們活力洋溢的在線社區吧。免費注冊,無限閱覽。

社交賬號一鍵登入

已有54300名科研人員在此注冊。

Found this useful?

If so, share it with your fellow researchers