喺科學觀測或者社會調查度攞到嘅數據,通常會攞算術平均嚟做代表值。但係,要諗清楚下算術平均係咪真係幫到你反映數據特徵,有時可能未必。通常如果數據係正態分佈,咁你用算術平均同標準差就啱晒啦。但係,如果數據唔係正態分佈,咁算術平均就可能唔係咁啱用,未必反映到大家普遍嘅情況。
舉個例,諗下香港人嘅收入。根據2023年嘅數據,香港打工仔每個月嘅中位數收入係$19,800,但平均收入就有$36,583。呢個咁大嘅差距其實係因為一小撮高收入人士拉高咗個數。結果就係,現實中好少家庭收入真係啱啱中晒呢個平均數。所以喺呢個情況下,數據唔係跟正態分佈。如果真係想睇到一般家庭收入,中位數或者最常見值會準啲。[1]
仲有,由於97%至99%嘅收入對數係跟對數正態分佈,咁用收入嘅幾何平均值嚟代表可能仲更啱。
如果數據分佈唔係對稱嘅,或者有啲極端數據值(即係啲離譜嘅數),你可以諗下用刈除平均,即係剔除最大同最細值,再計返個平均數。如果平均同中位數、最常見值、中點值有段距離,可能要諗下唔好用平均數,用啲第啲方法嚟表達數據會好啲。
講開統計學呢樣嘢,講「平均值」通常講緊算術平均,講白啲就係平均數啦。呢個係用啲數據計出嚟嘅統計指標值嚟㗎。
統計學入面有阿媽平均同細路平均之分。阿媽平均就係將成揪嘢平均,即係全部數據加埋嘅平均啦。細路平均就係喺抽返啲數出嚟嘅(即係抽樣)嘅平均數。啲學者慣常用 μ 嚟代表阿媽平均,用 m 嚟代表細路平均。
又叫算術平均,英文:arithmetic mean。
算術平均嗰條數就係咁㗎:
-
即係話,將成堆數加埋,再擘開嚟計。你都可以咁樣寫:
-
呢啲數嘅算術平均可以用 嚟寫。
算術平均啱用喺有得加有得乘嘅數,譬如實數、複數、向量噉。
如果啲數據有唔同嘅權重,咁就唔可以淨係攞算術平均,而係要考慮埋權重嚟計平均值。當每個數據 xi 係有自己嘅權重 wi 嘅時候,呢個加權平均(權重平均)就係咁計:
-
如果所有數據嘅權重都一樣,咁呢個加權平均就係一般嘅算術平均。
舉個例:喺權重最小二乘法裡面,我哋會比誤差細嘅數據更大嘅權重,然後最小化呢啲殘差嘅加權平均[註 1],咁樣就可以最大化似然。而喺優先抽樣入面,我哋喺用蒙地卡羅估計期望值嘅時候,會用求得嘅期望值嘅機率密度同樣本嘅機率密度比值作為權重,再攞加權平均嚟做估計量。
至於幾何平均嘅加權平均定義如下:
-
不過呢度嘅 。
如果數據 x(t) 喺區間 [a, b] 裏面連續分布,咁佢嘅算術平均就係積分
-
呢個積分係將離散分布嘅算術平均推廣到無限個平均值嘅極限形式。
如果 x(t) 係指數函數,咁佢嘅算術平均可以用端點嘅函數值 x(a), x(b) 嚟計算,
-
呢個結果叫做對數平均,喺對數平均溫度差等應用中用得上。
算術平均同加權平均都可以擴展到向量情況,向量平均同物理學入面嘅質心概念有關。幾何平均同調和平均就冇辦法定義。
對於向量 x1, …, xn,佢哋嘅(算術)平均定義為:
-
如果 n = 3,咁 x1, x2, x3 嘅平均就係呢三點所形成嘅三角形嘅重心。呢個結果可以推廣到 n 個向量嘅情況, x1, …, xn 嘅平均就係呢 n 點所形成嘅n單體嘅重心。
加權平均都可以同樣擴展到向量情況,定義為:
-
m次方平均同一般化平均係按標量定義為:
-
呢度嘅 ・ 係向量嘅範數。當 m = 2 嘅時候,x2}} 同內積 相等,所以當 m = 2 嘅時候,m次方平均同一般化平均特別重要。例如物理學中速率嘅平均值(均方根速度)有時會用 m = 2 嘅一般化平均。
對於向量加權平均嘅概念,我哋可以賦予其物理意義。假設質點 P1, …, Pn 分別喺位置 x1, …, xn,佢哋嘅質量分別係 m1, …, mn,咁加權平均
-
就係系統嘅重心。
假設a0, b0 係兩個滿足a0 > b0嘅非負實數。然後我哋定義a1, a2, …; b1, b2, …如下:
-
-
咁
-
就係a0同b0嘅算術幾何平均。
時間序列嘅數據會平滑化。呢個手法唔單止用喺數碼信號處理,例如圖像同聲音,仲用喺技術分析等金融領域,仲有氣象、水象等測量領域。
幾何平均(有時叫相乘平均)係咁搞㗎:
-
講普通啲,就係將成班數撈埋,然後開 n 次方根。呢個幾何平均同相乘平均其實係同一碟餸。
再講多次:
-
如果玩對數:
-
-
即係幾何平均其實係對數嘅算術平均,再整返個指數出嚟。或者你諗下,幾何平均嘅對數其實係啲對數嘅算術平均啫。
如果你啲數有零,幾何平均就變零。如果成堆數乘埋一齊係負嘅,咁幾何平均就唔喺實數度。如果你玩複數,就算你啲數全部都係實數,幾何平均都可能唔係得一個。
幾何平均啱用喺啲有得乘有得開根嘅數,譬如實數或者複數咁。
調和平均咁樣計:
-
或者
-
調和平均其實係逆數嘅算術平均嘅逆數。反過嚟講,逆數嘅算術平均就係調和平均嘅逆數。
如果你啲數有零,照原本嘅講法,調和平均就冇得計,但係如果當零係個極限,調和平均就會變零(即係 嘅時候 )。就算你啲數有負嘅,調和平均都計得出,但如果正負數撈埋一舊,逆數加埋可能變零,咁極限就會甩轆。
算術平均、幾何平均、同調和平均都可以用呢個公式嚟講:
-
或者
-
呢個係對應實數 p 嘅值,呢個平均數叫 p 一般化平均。
當 p = 1 就係算術平均,p = −1 就係調和平均,而 p → 0 嘅極限就係幾何平均。仲有,p = 2 嘅時候,就係二乘平均平方根 (RMS),喺物理同工程度成日見。p → ∞ 嘅極限係最大值,而 p → −∞ 嘅極限就係最細值。
一般化平均其實係將條數 嘅 p範數除以 嘅結果。
啲數嘅 p 次方平均,或者話,一般化平均嘅 p 次方:
-
叫做 p 次方平均。
呢個 p 次方平均、一般化平均喺統計學度都有用,譬如用喺方差同標準偏差。偏差(啲數減咗平均數之後嘅值)嘅2 次方平均就係方差。
一般化平均仲可以再玩多啲,例如用全射函數 f 嚟講:
-
譬如,f(x) = x 就係相加平均,f(x) = 1/x 就係調和平均,f(x) = log x 就係幾何平均。
|
相加平均 |
幾何平均 |
調和平均
|
|
|
|
|
|
|
|
|
|
|
|
|
講 p 一般化平均呢樣嘢,通常啲數要係正數先得㗎,因為要開p 次方根(即係冪函數),負數唔畀咁計。但係算術平均同調和平均(即係 p = ±1)就唔怕負數。除咗呢兩個之外,負數可能會整到一般化平均計唔到實數,就算計到都唔知點解釋好。
如果 p < 0 ,你啲數有零,咁就冇得用一般化平均嗰條數,但係可以學調和平均咁搞,當零係個極限,咁一般化平均就會變零。幾何平均(即係 0 一般化平均)都係咁,所以 p ≤ 0 嘅時候,一般化平均通常當係零。
** 譬如話1978年經濟飆升20%,1979年再升80%,咁呢兩年平均起咗幾多呢?就係 ,即係差唔多47%啦。
** 假設你去嘅時候每個鐘行60公里,返嘅時候每個鐘行90公里,咁成程平均行幾快呢?就係 。
** 調和平均仲可以用嚟計並聯電阻有幾大(例如喺串聯電路同並聯電路度計)。
如果你有 n 個正數,咁一定係:
- 算術平均 ≥ 幾何平均 ≥ 調和平均
-
要等號成立,就要:
- 。
左邊嗰個不等式可以用對兩邊取對數,再用log嘅凸性(即係延森不等式)嚟證(都有人用數學歸納法嚟證)。右邊嗰個不等式就係用調和平均係逆數嘅算術平均嘅逆數呢個特性,再用返左邊嗰個不等式嚟證。
呢個不等式仲可以擴到 p 嘅一般化平均度。