K-中點係一系列同 K-平均聚類法相似嘅聚類分析演算法

中點周邊分區 編輯

中點周邊分區(Partitioning Around Medoids,PAM)係種同 K-平均聚類法好似嘅做法,最基本如下[1][2]

  1. BUILD:首先,段演算法揀一點做中點(medoid),揀嘅原則係揀成本(cost;可以用同其他所有點之間嘅總距離)最低嗰點;
  2. 重複:揀成本最低嗰點出嚟做中點,直至揀咗   點出嚟為止;
  3. 將每點唔屬中點嘅點,掕落離佢最近嗰粒中點度;
  4. SWAP:如果能夠令成本下降,一路做
    • Foreach 中點  ,foreach 喺佢個聚類內嘅非中點  
      • 考慮將    掉換,計吓兩者掉換咗嘅話成本會點變;
      • 如果場掉換係目前最好(最能夠令成本跌)嘅,記住呢場掉換;
    • 如果做出最好嗰場     掉換會令成本跌,就郁手做;否則段演算法就算行完(converged)。

PAM 唔少人用(下圖係  gif 圖解),而且好多做統計相關工作嘅人都鍾意「PAM 冇乜隨機性」呢一樣嘢,不過 PAM 又畀人詬病話佢計得慢-PAM 要係噉計「呢點呢點同其他所有點之間嘅距離嘅總和」[2]

 
PAM 嘅 gif 圖解, 

睇埋 編輯

參考資料 編輯

  1. Kaufman, Leonard; Rousseeuw, Peter J. (1990-03-08). "Partitioning Around Medoids (Program PAM)". Finding Groups in Data: An Introduction to Cluster Analysis. Wiley Series in Probability and Statistics. Hoboken, NJ, USA: John Wiley & Sons, Inc. pp. 68-125. doi:10.1002/9780470316801.ch2.
  2. 2.0 2.1 Helm, Martin (2021-08-20). "A deep dive into partitioning around medoids". Towards Data Science. 喺2022年9月26號搵到.