無論是人文科學的訪談結果,或自然科學的實驗數據,學術研究經常會需要用到統計資料。
然而,許多作者往往不知如何適當地整理及使用資料,有些作者甚至選擇直接把所有資料都放在文章內,造成內文過於冗長。
因此,本文章將列舉三點建議,讓讀者能在學術文章中正確使用統計資料。
在內文中討論需要的資料
許多作者習慣把統計資料放在表格內,又在內文中重新整理一遍所有資料,造成讀者在閱讀文章時無法快速掌握作者想表達的內容。
我的建議是,可以將所有統計資料以表格方式呈現,但在內文中只要探討能回答論文假說或與假說有關的統計資料即可,不需將所有資料都在內文中重新覆誦一遍。
比方說,一篇學術文章探討年紀與疾病的關聯性,並統計不同年齡的病人有多少疾病。在統計過程中,研究者可能會額外記錄病人的性別、職業、居住地等其他資訊,但除非這篇文章也要討論這些因子是否會影響年紀與疾病的關聯性,否則將這些額外統計的資料放在內文中的表格即可,不必在內文重複講述所有的資料。
如此一來,既能減省篇幅,也能幫助讀者快速掌握作者想強調的重點。
關聯性與因果關係
學術研究常以相關係數來表達兩組資料之間的關係,並用統計檢定來證明兩組資料的關聯性具有顯著性。
然而,有些作者會把關聯性誤認為是兩組資料之間的因果關係。關聯性和因果關係是不同的觀念,這兩組資料可能同時受第三組資料影響而有關聯性,也有可能只是碰巧兩組資料有關連性。
比方說,喜歡吃糖的小孩跟高蛀牙率高度相關,但這關聯性可能是受小孩刷牙頻率或糖果成分兩種因素共同的影響,因此喜歡吃糖的小孩不一定會導致高蛀牙率。所以,在使用統計資料探討關聯性和因果關係時,要避免將兩者混淆。
避免用百分比說明比較
有些學術文章在比較統計資料時,習慣用百分比來比較兩份資料的差異,像是用百分比來比較兩個群體中各自有多少比例的人支持某議題。然而,百分比適合用來強調單一群體內的比例,用百分比來比較資料容易讓讀者對資料產生誤會,因此百分比要有基數才適合拿來比較。
比方說,兩份訪談分別有70%和20%的受訪者贊成某議題,但第一份訪談總數只有20人,第二份訪談總數卻有200人,總數落差很大。
因此,如果單純以百分比強調比例上的差距便容易造成誤導,誤以為多數受訪者贊成某議題。百分比需要在有能比較的基數時才能比較差異,必須要能上下文中完整交代總體的情況,否則百分比不適合單獨用來比較統計資料。