- 文章
- 最新
生物醫藥領域常見的5個統計學概念

作為生物醫藥研究者,厘清統計學概念并在論文中正確使用它們能避免讀者對數據的誤讀。本文例舉了五種統計術語,它們是研究型論文中的高頻詞匯,同時也是新手容易混淆的概念。
1.正態
normal在統計學中譯為正態分布,也稱為高斯分布。當連續隨機變量的曲線為鐘形時,即為正態分布。由于normal在英語中也有通常、典型的意思,在寫作時最好明確語義。舉例來講,“A patient's blood pressure is normal.”這句話既可以理解為病人血壓正常,也有病人血壓值遵循高斯分布的意思。這種情況作者需在上下文中明確自己想表達的是什么。
2.隨機
random一詞的常見翻譯是任意、隨意,不過它在統計中另有所指。random sampling即為隨機抽樣,意思是從總體中抽樣的每個個體被選中的機會均等,一般通過電腦生成隨機數來實現。“We selected patients randomly for a clinical trial.”這句話可以理解為我們隨機抽樣了臨床試驗的患者。“We assigned patients randomly to treatment groups.”的意思則是我們在分配治療組的時候采用了隨機法。
3.平均值
average通常在統計中用于表示算術平均值,即為一組值的總和除以值的數量。不過由于average在日常英語中也有“一般的”這層含義,所以應盡量避免“The biomarker had average sensitivity.”一類的表述,容易產生歧義。可以用“the value of the average sensitivity”取代。
4.顯著
英語中通常用significant表示重要的、有意義的。它在統計學中用來描述數據的顯著性,當p值小于α值,實驗結果顯著。如要表達治療結果具有顯著性,可以說“statistically significant”或將措辭調整為臨床結果“clinically meaningful.”
5.相關性
correlation在統計學中是指兩個連續變量之間有聯系。此處需要明確的是相關有別于因果關系,這是兩種性質不同的邏輯關系。比如當我們說“There is a positive correlation between alcohol intake and asthma severity.”,意思是酒精攝入量越高的樣本哮喘越嚴重。根據這則相關表述,我們可以建議在哮喘治療中加入對酒精攝入的限制,但不能說少飲酒一定可防止哮喘病發。
希望所有需要和數據打交道的研究者,都能得出可靠的數據,并做出準確詮釋。