統計相關

(由正相關跳轉過嚟)

統計相關英文statistical correlation)喺統計學上嘅定義如下:

  • 如果話 呢兩個變數正相關(positive correlation),即係話 數值高嗰陣 數值都傾向高,而 數值低嗰陣 數值都傾向低;
  • 如果話 呢兩個變數成負相關(negative correlation),即係話 數值高嗰陣 數值傾向低,而 數值低嗰陣 數值就會傾向高;
  • 如果話 呢兩個變數冇明顯相關(not correlated),即係話 嘅數值唔會點預測得到 嘅數值。

常用計法

睇埋:皮亞遜積差相關係數

皮亞遜積差相關係數(Pearson correlation coefficient)係統計學成日用嘅一個指標,「兩個變數    之間嘅皮亞遜積差相關係數」( )係噉樣定義嘅:

 
  •   係第   個個案嘅   數值;
  •   係第   個個案嘅   數值;
  •   係啲個案喺   上嘅平均值(mean);
  •   係啲個案喺   上嘅平均值;
  •   係啲個案喺   上嘅標準差(standard deviation);
  •   係啲個案喺   上嘅標準差。

呢條式會得出一個相關值(correlation value),個數值會喺 -1 同 1 之間,負數表示兩個變數成反比(一個數值高嗰陣另一個傾向數值低),而正數就表示兩個變數成正比(兩個數值傾向一齊高或者一齊低),個相關值愈接近零表示兩個變數之間嘅關係愈弱,而如果個相關值等於零就表示兩個變數根本唔啦更。喺做相關性研究嗰陣科學家會先收集一啲數據,再用好似上面呢條式等嘅方法計出變數之間嘅相關值,搵出研究緊嘅變數之間有乜嘢啦掕,而呢個過程俾出嚟嘅資訊喺將來有得攞嚟預測某啲現象[1]

 
圖嘅 X 軸Y 軸代表變數   ,每個有色圓點代表一個個案,每個個案都喺    上各有數值,而每幅圖表示唔同   值下啲數據會係點嘅樣。

睇埋

  1. Rodgers, J. L.; Nicewander, W. A. (1988). "Thirteen ways to look at the correlation coefficient". The American Statistician. 42 (1): 59–66.