困惑度

困惑度（英文：perplexity， $PP$ ）反映一個概率分佈「有幾能夠預測個樣本」，一個離散概率分佈 $p$ 嘅困惑度計法如下－

{\mathit {PP}}(p):=2^{H(p)}=2^{-\sum _{x}p(x)\log _{2}p(x)}=\prod _{x}p(x)^{-p(x)}

，當中

$H(p)$ 係個概率分佈嘅資訊熵。簡單講，困惑度愈高，就反映個概率分佈愈做唔到肯定嘅預測（所以困惑度愈高，表示個概率分佈愈係差）^[1]^[2]。

自然語言處理好興用「個程式對每隻字嘅困惑度」嚟做量度「個模型有幾掂」嘅基準。

睇埋

攷

↑ Two minutes NLP — Perplexity explained with simple probabilities. Medium.
↑ Perplexity Intuition (and its derivation). Medium.

呢篇同數學相關係楔位文。歡迎幫維基百科擴寫佢。

由「https://zh-yue.wikipedia.org/w/index.php?title=困惑度&oldid=1812563」收