流程探勘
呢篇文 需要熟悉呢方面嘅人幫手寫。 |
流程探勘(粵拼:lau4 cing4 taam3 ham3 | 英文:process mining)係數據科學上一系列用嚟分析 event log 嘅方法。
概論
編輯睇埋:數據探勘
旨在想由 log 嘅數據度搵出「啲人嘅行為會跟從咩規律」噉嘅知識[1]。做 PM 可以用到好多唔同嘅演算法,不過啲演算法嚟嚟去去都係做緊 3 樣嘢當中其中一樣[註 1]:
- Discovery:由數據度建立描述啲人嘅行為嘅模型;
- Conformance:計吓數,睇吓現有嗰個模型預測嘅行為同數據實際睇到嘅有幾大出入;
- Extension:睇吓現有嗰個模型可以點調整,令個模型更加能夠準確預測啲人嘅行為;
分析者攞住啲 log 數據,會或多或少噉執吓佢先-包括係剷走啲明顯出咗錯嘅數據,甚至將啲數據入面嘅數值做些少轉換,即係例如手上已有「用家喺呢段期間邊啲時間點撳咗掣」噉嘅資訊,可以簡單噉計出「用家喺嗰段期間撳咗幾多次掣」呢樣資訊[2]。跟住分析者就可以用啲數據建立統計模型,用啲模型嘅方程式嚟模擬用家嘅行為。
例如下圖就係一個典型嘅流程探勘模型,將用家嘅行為想像成「首先做 A,然後做決策(decision point
),決定跟住要去 B C 定 E...」噉嘅樣。分析者可以睇吓呢個模型會預測嘅行為規律同數據實際睇到嘅爭幾遠。
睇埋
編輯註釋
編輯攷
編輯- ↑ Ma'arif, M. R. (2017, September). Revealing daily human activity pattern using process mining approach (PDF). In 2017 4th International Conference on Electrical Engineering, Computer Science and Informatics (EECSI) (pp. 1-5). IEEE.
- ↑ Ramadan, S., Baqapuri, H. I., Roecher, E., & Mathiak, K. (2019, June). Process mining of logged gaming behavior. In 2019 International Conference on Process Mining (ICPM) (pp. 57-64). IEEE.