混淆矩陣粵拼wan6 aau4 geoi2 zan6英文confusion matrix)係機械學習相關領域上成日用嘅一種矩陣,可以用嚟將一個模型做嘅分類「視覺化」噉表現出嚟。

概論

編輯

如果一個模型係做二元分類嘅,模型質素亦可以用靈敏度同特異度作為指標嚟量度。靈敏度同特異度包括咗四個數值:

  • 歸啱咗啲陽性個案嘅真陽性率(TRP)
  • 歸啱咗啲陰性個案嘅真陰性率(TNR)
  • 歸錯咗啲陽性個案嘅假陽性率(FRP)
  • 歸錯咗啲陰性個案嘅假陰性率(FNR)

呢四個數值可以用 2 × 2 嘅混淆矩陣表達,好似以下噉[1][2]

模型做嘅預測
陽性 陰性
實際類別 陽性 真陽性嘅
個案數量
假陰性嘅
個案數量
陰性 假陽性嘅
個案數量
真陰性嘅
個案數量

睇埋

編輯

引述

編輯
  1. Provost, Foster; Fawcett, Tom (2013). Data science for business: what you need to know about data mining and data-analytic thinking (1. ed., 2. release ed.). Beijing Köln: O'Reilly.
  2. Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I. (eds.). Encyclopedia of machine learning. Springer.