統計學粵拼tung2 gai3 hok6)上嘅數據同分析方法對科研有巨大嘅幫助,但又時不時會俾人誤用。有人就曾經噉講:

同一樣嘅數據有得用唔同嘅方法呈現。
原版英文:"There are three kinds of lies: lies, damned lies, and statistics."

粵文翻譯:世上有三種大話:大話、抵死嘅大話、同埋統計數字

舉附圖嚟說明,同一樣嘅統計數據可以用唔同嘅方法呈現,而唔同嘅呈現方法可以攞嚟誤導人,好似係附圖嗰兩幅棒形圖噉,兩幅圖表達嘅數據一樣,都係表達緊一間公司喺 2010 同 2011 年嘅銷售量(Y 軸係銷售量,X 軸係年份),但係兩幅圖嘅原點唔同-左圖嘅 Y 軸係以 36 做起點,右圖嘅以 0 做起點,令到前者望落好似賺多咗好多錢噉。除此之外,對分析嘅結果又有得用唔同嘅方法解讀,搞到好多人會特登用對自己有利嘅呈現同解讀方法嚟誤導人,而美國作家達利哈夫(Darrell Huff)嘅書《How to lie with statistics》(粵文:點樣用統計學講大話)就揭露咗好多生意人政治家等嘅人物用類似嘅詭計嚟呃人嘅例子[1]

要預防統計學嘅誤用有好多方法,包括要用啱嘅圖表等等[2]。而且喺將用統計得出嘅結論普遍化嗰陣,要留意佢會唔會超出咗個樣本代表到嘅範圍,只有個當樣本可以代表到個總體嗰陣,統計方法得出嘅結果先至算係可信、精確嘅,例如係一份用白人做樣本嘅醫學研究得出嘅結論未必啱唐人[3]

  1. Huff, D. (1954). How to Lie With Statistics, WW Norton & Company, Inc. New York, NY. ISBN 978-0-393-31072-6
  2. Drennan, R. D. Statistics in archaeology. (Edit) Pearsall, Deborah M. Encyclopedia of Archaeology. Elsevier Inc. 2008: 2093–2100.
  3. Cohen, J. B. Misuse of Statistics. Journal of the American Statistical Association (JSTOR). 1938年12月, 33 (204): 657-674.