K-中點
呢篇文 需要熟悉呢方面嘅人幫手寫。 |
中點周邊分區
編輯中點周邊分區(Partitioning Around Medoids,PAM)係種同 K-平均聚類法好似嘅做法,最基本如下[1][2]:
- BUILD:首先,段演算法揀一點做中點(medoid),揀嘅原則係揀成本(cost;可以用同其他所有點之間嘅總距離)最低嗰點;
- 重複:揀成本最低嗰點出嚟做中點,直至揀咗 點出嚟為止;
- 將每點唔屬中點嘅點,掕落離佢最近嗰粒中點度;
- SWAP:如果能夠令成本下降,一路做
- Foreach 中點 ,foreach 喺佢個聚類內嘅非中點 :
- 考慮將 同 掉換,計吓兩者掉換咗嘅話成本會點變;
- 如果場掉換係目前最好(最能夠令成本跌)嘅,記住呢場掉換;
- 如果做出最好嗰場 掉換會令成本跌,就郁手做;否則段演算法就算行完(converged)。
- Foreach 中點 ,foreach 喺佢個聚類內嘅非中點 :
PAM 唔少人用(下圖係 嘅 gif 圖解),而且好多做統計相關工作嘅人都鍾意「PAM 冇乜隨機性」呢一樣嘢,不過 PAM 又畀人詬病話佢計得慢-PAM 要係噉計「呢點呢點同其他所有點之間嘅距離嘅總和」[2]。
睇埋
編輯參考資料
編輯- ↑ Kaufman, Leonard; Rousseeuw, Peter J. (1990-03-08). "Partitioning Around Medoids (Program PAM)". Finding Groups in Data: An Introduction to Cluster Analysis. Wiley Series in Probability and Statistics. Hoboken, NJ, USA: John Wiley & Sons, Inc. pp. 68-125. doi:10.1002/9780470316801.ch2.
- ↑ 2.0 2.1 Helm, Martin (2021-08-20). "A deep dive into partitioning around medoids". Towards Data Science. 喺2022年9月26號搵到.