Menu

如何在醫學寫作中表示統計結果

2015 / 2 / 19

218

0 將此網站加入您的書簽

提問:

「您可以討論一下在研究論文中的方法與結果部分要如何表示統計數據嗎?您可以特別討論如何表示生物統計學的數據嗎?」

―長庚大學醫院演講與會者於 Email 中提出

回答:

表示統計結果

在科學研究與醫學發表刊物上,我們可以看到越來越多人採用不同的統計方法。在科學論文裡,統計方法被用以彙整及分析研究中蒐集到的數據,作者應該要詳盡地描述所採用的方法,如此一來,博學的讀者才能以原始數據和相同的方法來驗證研究結果。如今,我們很輕易地便能取得容易上手的統計軟體,但卻也造就統計分析技術的濫用,大量令人混淆的數據與統計結果隨之而生。

此篇文章旨在提供作者實際的資訊,幫助他們在研究中清楚且正確地呈獻統計數據。在此篇文章的結尾,我們推薦一些教科書與期刊文章,其中對統計方法都有詳細的描述。然而,研究者如果想要設計並在研究中進行最適當的統計分析,則必須在研究設計初期諮詢有經驗的生物統計學家。接下來,我們將介紹統計方法與數據成果通常會出現在科學論文中的哪些段落中。

於材料與方法章節中呈現統計結果

研究設計

描述研究設計的主要特徵,並指出依變項。正確且詳細地描述研究設計,未來在需要的時候才能再重現相同的研究。在此可用相關的研究╱取樣╱資料流程圖表,作為輔助來說明複雜的取樣和研究設計,以期更精確地傳達研究資訊。

母群體與樣本數

描述研究的目標母群體,介紹樣本的類型、選擇樣本的方式(隨機取樣或是使用了任何分層抽樣)、樣本來源、納入及排除條件、不同處理方式的分配機制(隨機或非隨機 randomized or non-randomized)以及是否使用盲法技術 blinding techniques(單盲或雙盲 single or
double blind),並描述預計的樣本數量以及依變項。除此之外,還須指出針對資料分佈所做的假定、顯著水準的決定方式、以及樣本數量是基於怎麼樣的協定力基礎。最後說明樣本數量的計算方法並驗證所做的假設。

數據收集

針對以調查方式進行的研究,必須描述資料收集的方法,並提供相關細節(如問項數量、問卷答覆的分數範圍、以及各個分數代表的意義)。說明研究個體數,並詳述流失率,如:退出臨床試驗的與試者。

統計分析

首先,清楚描述統計分析的主要特徵(如:信賴區間 confidence interval、信賴度 degree of confidence、包含虛無假設與對立假設的假設試驗 degree of confidence、顯著水準 level of significance、特定的試驗與試驗統計數據particular tests and test statistics)。列出使用到的統計技巧,若文中有使用到複雜、進階的技巧,記得提供合適的參考文獻。可能的話,盡可能列出一般研究論文作為參考文獻(附上頁數,以利讀者查閱),而非提及最初提出這項技巧的研究論文。再來描述文中用以處理遺漏數值、資料或離群值所採用的程序(並提供所使用離群值 outlier的定義)。最後描述曾執行的模型假設試驗(例如常態性試驗或適合度檢定 test of normality or goodness-of-fit tests),並指出分析過程中使用的統計軟體及版本,同時提供軟體製造商、城市、與製造國家等資訊。

於結果段落呈現統計數據

請仔細且清楚地呈現主要分析的結果,解釋這些結果如何滿足了研究目的。在表格或圖中繪出重要變數的主要特徵,或以表格呈現統計數據總覽、結果總覽、以及與 p 值相關的數值,並使用適當的集中趨勢量度及離度作為統計數據概要。舉例來說,列出高度偏離資料的中位數。若使用了 a ± b 這類的標記符號,請清楚描述 b 代表了什麼,它有可能是標準差或標準誤。在呈現統計試驗的結果時,請詳盡描述任何已經建立的假設。

請依照接下來的範例,盡可能地提供完整的研究成果細節:寫出試驗名稱,緊接著加上一個冒號,然後是試驗統計量(包括任何自由度)與 p 值。

例如:

ANOVA: F2,6 = 5.6, p = 0.02

chi-square test: 2 = 16.81, p = 0.01

使用臨床上相關的量度來描述變數的效果,例如,以十年為一個增量描述年齡的影響,而不是以一年為一個增量;或以十公斤而非一公斤為一個增量描述重量的影響。避免在統計數據中以非術語的方式使用術語,例如「random」(其暗指著隨機裝置)、「normal」、「correlations」、與「significant」。在寫作時,應該清楚定義所有的統計詞彙、縮寫及符號。

有效數字

使用適當的有效數字以呈現平均數或其他測量和計算數值。有效數字應當反映原始測量的精確程度,任何的測量或計算都不應該以「大約」、「將近」等詞彙描述。

以下有幾個範例:

• The mean age of adults only needs to be reported to one decimal place, not four (e.g. 68.1 years, not 68.1276 years).

• For summary statistics (e.g. mean and standard deviation), report one digit more than was presented in the raw data.

• If age is recorded to the nearest whole year, report the mean age to the nearest tenth of a year (e.g. mean = 54.3 years).

• For percentages, the nearest whole percent (e.g. 25%) is usually adequate, although some journals prefer percentages to the nearest tenth of a percent(e.g. 25.4%).

• For test statistics, such as the chi-square statistic, t statistic and F statistic, report to two decimal places for accuracy, e.g. t statistic = 2.56.

p
值與信賴區間

所有的主要分析都應該列出確切的 p 值,如 p = 0.65,寫出確切的 p 值比使用「不顯著」等詞彙來得恰當,已呈現於圖表中的 p 值則不需在文章內重複撰寫。提供信賴區間以詳細描述 t 試驗(或其他試驗)的結果,簡單的描述,如 p < 0.05是不夠的。

以下是相關範例:

The difference between the sample mean systolic blood pressure in diabetic patients and non-diabetic patients was 6.0 mmHg, with a 95% confidence interval from 1.1 to 10.9 mmHg; the t-test statistic was 2.4, with 198 degrees of freedom and an associated p-value of 0.02.

避免於統計假設檢定中使用單一數據來源,例如,若只使用 p 值,可能會無法傳達重要的質化訊息。

統計與臨床顯著性

統計顯著性必須與臨床顯著性做出區分。統計顯著性是一種統計上的計算,若某個給定的關聯性超過此顯著性,則視為機率所為。而臨床顯著性則代表研究發現對病人或臨床實驗會造成可測量的影響,不顯著的結果也未必證明了虛無的假設。所謂的「統計上顯著」的發現,代表研究者有 95% 的信心認為該關聯存在。然而,統計上顯著的發現不一定能證明因果關係,也未必代表研究結果會在臨床上顯著。

總結

科學論文中的統計方法可用於總結研究中所提出的資料搜集或分析結果。統計方法的正確使用,以及在科學論文中的呈現方式,兩者皆影響到研究的完整度。因此,研究者應當隨時進行統計判斷。我們強烈建議作者在設計一份研究之前,先行諮詢生物統計學家,以確保選擇了適當的統計方法。除了統計分析之外,生物統計學家也能幫您審閱實驗結果的呈現與解讀,這對於使用了較複雜統計方法的研究尤其重要。

常犯的錯誤:

• 假設 p 小於 0.005 (統計上顯著),此研究結果就值得發表。

• 使用統計顯著性證明臨床顯著性。

• 假設不顯著的結果證明了虛無假設。

請謹記以下重點:

1. 隨時進行統計判斷。

2. 開始研究之前即尋求生物統計學家的建議,而非等到取得了所有結果才這麼做。

學術寫作中有效的項目條列方式
如何準備醫學論文的參考文獻?