語音感知

語音感知（粵拼：jyu5 jam1 gam2 zi1；英文：speech perception）係指對講嘢嘅聲嘅感知。呢個領域包括咗想研究人腦點樣判斷聽到嘅聲波，將啲聲波（例如）响腦海入邊斬做一段段音節或者分辨唔同嘅輔音。

基本定位

語音感知研究，包括一個人聽、詮釋同理解語音嘅過程^[1]。

呢個過程並唔簡單：事實表明，語音嘅語言特性好少可會同聲學特性有一對一對應；例如廿一世紀初嘅研究已經清楚表示，冇任何一個語音聲學特性可以單獨預測聽者對元音同輔音嘅判斷。噉即係話人腦分辨聽到嘅語音「有邊啲元音同輔音」嗰陣，會同時考慮多個變數。數學化啲噉講，一吓聲「有幾高音」响語音感知上算係一個相對簡單嘅語言特性，因為人腦對音高嘅判斷主要淨係取決於一個因素—語音嗰股聲波嘅頻率：

{\text{jam gou}}=f({\text{pan leot}})

相比之下，人感知「聽到嗰段音節，有乜嘢元音同輔音」，就明顯唔係齋靠一兩個物理量嘅。

基本概念

聲質提示

聲質提示^{[e 1]}泛指任何人腦會用嚟做語音感知、分辨唔同語音嘅感官提示。

要留意嘅係，唔同語言响「語音要點分法」呢一點上可以有差異。詳情可以睇睇音素嘅概念。

研究方法

語音感知研究往往會結合認知心理學同腦神經學等領域嘅方法。舉個例，語音學家可以搵一班受試者返嚟，畀佢哋聽吓幾款唔同嘅語音，一路暗中操縱啲語音嘅聲波特性，然後再睇吓受試者對語音嘅判斷會唔會唔同咗，從而窺探人個腦係點樣處理語音嘅。呢種做法好似認知心理學上成日用嘅心理實驗^[1]。

語音分割

語音分割^{[e 2]}係語音感知研究上嘅一個重要課題。

首先，人類好明顯會將語音聽做一個個離散嘅單位，例如一段段音節或者一隻隻字詞呀噉；但語音學家一望語音數據就發現，呢啲單位之間（音節同音節間，或者字詞同字詞間）响聲波特性上冇任何明顯分界可言；想像例如粵語 soeng5 tong4（漢字：上堂）呢隻字詞嘅語音，母語係粵語嘅人會聽得出「呢段聲有兩段音節咁多」，但攞幅時頻譜睇吓嘅話，就會發現呢兩段音節之間並冇任何「乜嘢聲都冇晒」嘅時間；噉就表示，人腦實係喺腦海入邊將嗰段連續嘅語音斬咗做兩橛，並且做出「呢段聲有兩段音節」噉嘅判斷。呢種認知功能就係所謂嘅語音分割^[1]。

如果用電腦化啲嘅方式諗，語音分割可以想像成以下噉嘅演算法：

攞嘅 input 係一段語音；
出嘅 output 係「段語音包含幾多段同埋乜嘢音節」。

不變異問題

不變異問題^{[e 3]}係語音感知研究上嘅另一個大課題。

事實表明咗，同一個音素可以用好多款唔同嘅聲波嚟呈現：例如講講粵語嘅 si1（漢字：詩、絲同斯... 等）音節，想像而家搵男女老幼多個粵人，叫佢哋齊齊發出 si1 嘅音節，佢哋個個發出嘅聲都唔同—女人嘅聲平均嚟講高音過男人嘅，而成年女人嘅聲同細路女嘅聲又會有啲唔同；就算性別同年紀一樣，個個人把聲都唔同，而且有啲人講嘢快啲有啲人講嘢慢啲，而事實係如果用時頻譜等嘅方法睇吓呢班人發出嘅聲波，就會發現個個產生嘅聲波都唔一樣。不過同時好明顯嘅係，一個母語係粵語做嘅人能夠將呢啲唔同聲波冚唪唥都當係同一款音節（都係 si1）—於是就引起咗語音學家有以下嘅思考^[2]：

聽者响腦海入邊判定呢幾股聲波係一樣嘅，但係响物理上呢啲聲波明顯缺少「不變異」呢種特性。點解呢？

睇埋

引述

呢篇文用咗嘅行話，英文（或者第啲外語）版本如下：

↑ acoustic cue
↑ speech segmentation
↑ invariance problem

呢篇文引用咗以下呢啲文獻同網頁：

↑ ^1.0 ^1.1 ^1.2 Nygaard, L.C., Pisoni, D.B. (1995). "Speech Perception: New Directions in Research and Theory". In J.L. Miller; P.D. Eimas (eds.). Handbook of Perception and Cognition: Speech, Language, and Communication. San Diego: Academic Press.
↑ Serniclaes, W. (2005). On the invariance of speech percepts. ZAS Papers in Linguistics, 40, 177-194.

[2] ustic cue

[3] speech segmentation

[4] variance problem

[nygaard95-1] 1.0 ^1.1 ^1.2 Nygaard, L.C., Pisoni, D.B. (1995). "Speech Perception: New Directions in Research and Theory". In J.L. Miller; P.D. Eimas (eds.). Handbook of Perception and Cognition: Speech, Language, and Communication. San Diego: Academic Press.

[5] Serniclaes, W. (2005). On the invariance of speech percepts. ZAS Papers in Linguistics, 40, 177-194.

[1]

[e 1]

[e 2]

[e 3]

[2]