K-平均聚類法
呢篇文 需要熟悉呢方面嘅人幫手寫。 |
做法
編輯K-平均聚類法嘅出發點係假定咗已知拃數據分幾多個聚類(聚類數量 )。喺最簡單嗰種情況下,K-平均聚類法可以噉嚟想像[1][2]:
- 設 做個案嘅數量而 做聚類數量;
- 建立 咁多個中心點(cluster center),每個中心點嘅位置叫 [註 1];
- 是但攞其中一個個案 嚟睇, 表示 同離佢最近嗰個 之間嘅距離;
- 慢慢調節啲中心點嘅位置[註 2],務求令啲 嘅總值有咁細得咁細[註 3][3]。
數學化啲噉講,K-平均聚類法係要將 個個案分拆做 個集( ), ,搵出:
K-平均聚類法亦可以用圖嚟表示。睇吓附圖幅 gif:想像家陣 ,研究者想將啲數據分做三個聚類-聚類由藍色圓圈、黃色交叉同埋紅色十字代表;當中大藍色圓圈、大黃色交叉同大紅色十字表示嗰三個聚類嘅預想中心點;K-平均聚類法就可以當成一次一次(隨住 iteration
數值上升)噉郁動三個中心點,直接達到理想數值(例如 嘅總值去到最細)為止。
註釋
編輯睇埋
編輯參考資料
編輯- ↑ Tryon, Robert C. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards Brothers.
- ↑ Arthur, David; Manthey, B.; Roeglin, H. (2009). "k-means has polynomial smoothed complexity". Proceedings of the 50th Symposium on Foundations of Computer Science (FOCS). arXiv:0904.1113.
- ↑ 引用錯誤 無效嘅
<ref>
標籤;無文字提供畀叫做kaufman1990
嘅參照