運算語言學 wan6 syun3 jyu5 jin4 hok6 (computational linguistics )係語言學 嘅一門,專用電腦模擬 噉嘅運算方法嚟研究語言 。
語言模型 (language model)係一種「模擬」語言嘅數學模型 。一個語言模型通常會源自畀電腦 讀取大量嘅語料 ,形成一個概率分佈 ;數學化啲噉講,即係話一個語言模型能夠畀到
Pr
(
w
1
,
…
,
w
m
)
{\displaystyle \Pr(w_{1},\ldots ,w_{m})}
(一句句子啲字係
w
1
,
…
,
w
m
{\displaystyle w_{1},\ldots ,w_{m}}
嘅機率 )
Pr
(
w
5
|
w
1
,
…
,
w
4
)
{\displaystyle \Pr(w_{5}|w_{1},\ldots ,w_{4})}
(已知 句句子啲字係
w
1
,
…
,
w
4
{\displaystyle w_{1},\ldots ,w_{4}}
,下一隻字係
w
5
{\displaystyle w_{5}}
嘅機率)
... 等嘅數值,當中啲機率數值好多時係靠人工神經網絡 計出嚟嘅[ 1] 。例如好出名嘅 ChatGPT 就係一個語言模型。
↑ Ponte, J. M., & Croft, W. B. (2017, August). A language modeling approach to information retrieval. In ACM SIGIR Forum (Vol. 51, No. 2, pp. 202-208). New York, NY, USA: ACM.