困惑度英文perplexity)反映一個概率分佈「有幾能夠預測個樣本」,一個離散概率分佈 嘅困惑度計法如下-

,當中

係個概率分佈嘅資訊熵。簡單講,困惑度愈高,就反映個概率分佈愈做唔到肯定嘅預測(所以困惑度愈高,表示個概率分佈愈係差)[1][2]

自然語言處理好興用「個程式對每隻字嘅困惑度」嚟做量度「個模型有幾掂」嘅基準。

睇埋

編輯