構詞學

研究啲詞語同埋佢哋嘅形成

構詞學粵拼kau3/gau3 ci4 hok6),貼近英文名[e 1]意譯可以叫語言形態學,係語言學其中一個最重要嘅分科,專門研究字詞嘅結構同埋字詞係點樣組成嘅。構詞學最基本嘅概念係形態素:形態素簡單講即係有意思嘅最細單位,一嚿形態素再斬細啲就唔會再有原先個意思。構詞學家憑住呢啲概念,分析人腦點樣運用形態素砌字詞出嚟[註 1]

語言嘅構詞功能可以大致分兩類:詞形變化構詞衍生;詞形變化包括一隻字詞變樣,表達件事幾時發生啲物體有幾多件、或者係個詞喺語句入便扮演咩角色... 等嘅資訊;而構詞衍生就涉及同啲字詞加詞頭或者詞尾,創造出有新意思嘅字詞。

構詞仲會影響語言嘅其他部份。例如一個字詞可以點做詞形變化,好多時都受制於佢喺句法當中嘅角色;除此之外,一隻語言嘅構詞法則仲會影響佢嘅演變進程——事實表明,一隻語言嘅使用者造新詞嗰陣,往往會受制於自身語言嘅構詞法則,而新詞創造係語言演變嘅重要一環。

概念:詞素

編輯
内文:詞素

構詞學研究嘅係字詞、字詞嘅內部結構、以及字詞係點形成嘅。响 2024 年,不列顛百科全書係噉嚟形容構詞學[1]

構詞學旨在要研究字詞嘅內部結構。

字詞呢個概念定義有些少含糊[2][3]。語言學上研究構詞,通常會由形態素(又有叫詞素)呢個概念出發。形態素一詞意譯英文

morpheme(近似粵拼mo1 fim4

——呢隻字詞取自希臘文 morphē [4],即係希臘文入便形態、形狀噉嘅意思[5]。定義上,形態素係指可以有意思嘅最細可能單位,唔一定能夠自成一隻字詞。一嚿形態素再拆細啲就唔會再有意思,或者會冇咗原先嗰個意思。

詞素例子

編輯

用英文做例,想像以下嘅字詞[6]:1.2

字詞 詞性 意思
Redo 動詞 再做過
Reappear 動詞 再出現
Reconsider 動詞 再考慮

——當中 re- 呢嚿嘢本身唔能夠自成一隻字詞,但係可以帶有再...噉嘅意思,同時 re- 再斬細件啲就唔會再有乜嘢意思可言。所以 re- 喺英文入面係一嚿形態素[7]。其他歐洲語言都可以用噉嘅方法嚟想像。

形態素呢個概念源自歐美,但係好似粵語噉嘅漢語,都可以用類似嘅思路嚟諗,例如 dei6漢字)呢嚿一段音節長嘅嘢,粵語可以有[8]

粵拼 漢字
ngo5 dei6 我哋
nei5 dei6 你哋

等嘅字詞,當中表示咗眾數嘅意思,而 dei6 拆細佢變做例如 ei6 就會冇咗原先嗰個意思。粵語同英文 re- 有啲相似嘅係,佢哋正常講嘢嗰陣唔會單獨噉出現,意思指眾數嗰個出現親都係掕喺一個代名詞後面,而意思指再...嗰個 re- 出現親都係掕咗喺一個動詞前面

界定啲詞彙

  • 規範形態素[e 2]:好似粵語或者英文 re- 等冇得單獨存在嘅形態素。一種常見嘅觀點係,一款變化一定要用到規範形態素,先可以算得上係詞形變化[註 2]
  • 自由形態素[e 3]:好似粵語 ngo5(漢字作)或者英文 do噉解)等可以單獨存在嘅形態素。
  • 附著形態素[e 4]:一類嘅形態素,句法上似字詞,但係音系上「依賴」語句入面嘅其他字詞同短語。例如喺英文入便,thefor 喺句法上似自成字詞,但係喺重音規律上就要「依附」喺周圍嘅字詞嗰度[9]

基本原則

編輯

構詞學家做研究嗰陣,往往會跟從以下呢幾條原則(下面用咗國際音標[e 5][10]:1.5.2

  1. 兩嚿嘢,如果佢哋喺所有情況下意思同發音[註 3]都一樣,就算係同一款形態素。
    用粵語做例子,睇緊書入便嗰個同埋煲緊湯入便嗰個喺意思同發音上都一樣,已經自動可以算係同一嚿形態素[11],而相比之下,緊張入便嗰個就係一嚿同前兩者截然不同嘅形態素——前兩者入便嗰個係表示「動詞指嗰個動作正喺度進行」,而緊張入便嗰個就完全唔係噉嘅意思[註 4]
  2. 兩嚿嘢,就算佢哋嘅發音唔同都好,如果佢哋意思一樣而且分佈上冇重疊[註 5],都算係同一款形態素。
    用英文做例子,英文啲名詞如果係眾數,通常最尾都要加個 /s//z//əz/[註 6] ——例如可以睇睇 seat(一個座位)變 seats(多個座位;個尾讀 /s/)、 hedge(一埲籬笆)變 hedges(多埲籬笆;個尾讀 /əz/)... 等嘅字詞變化。雖然呢啲標示眾數嘅形態素發音唔同,但係佢哋意思一樣,都係表達眾數,而且佢哋分佈上冇重疊—— seats/s/ 尾)冇得話換做 seates/əz/ 尾),反之亦然,所以呢幾嚿標示眾數嘅形態素,可以當係同一款形態素噉睇。形態素變體[e 6]正正就係指緊發音唔同但係意思一樣嘅形態素,英文入便表示眾數嘅 /s/ 同表示眾數嘅 /əz/ 係同一款形態素嘅變體。
  3. 一隻形態素,有可能其中一個變體係(符號 Ø)。
    繼續用英文啲眾數變化做例子,有部份嘅名詞係無論單數眾數都一樣樣嘅,例如指fish/fɪʃ/)傳統上無論得一條魚定係有多條魚,隻字詞都係唔會變樣嘅;喺 fish 做眾數嘅情況下,可以將呢度嘅構詞想像成「講嘢嘅人腦入便暗中知道隻名詞指嗰樣嘢係眾數[註 7],但係眾數標記係」——用語言學符號寫,作 fish-Ø

等等。

字詞同詞位

編輯
内文:字詞詞位
睇埋:詞性符號

定義爭拗

編輯
 
呢份古希臘文獻上面寫咗古希臘文。好多古代社會用字母寫字嗰陣都唔識用空格,寫親字就將大串字母由頭無間斷噉寫到落尾(好似上圖份文獻噉),但噉唔表示佢哋嘅語言冇字詞呢樣嘢。

『字詞』對講嘢嘅人嚟講有『心理上嘅真實性』,令佢哋(講嘢嘅人)能夠討論一隻字詞係咩意思,討論隻字詞喺某一個社交場合入便適唔適用,等等。[12]

世上所有主流語言入便都有「字詞」呢個概念:無論係受過專業訓練嘅語言學家抑或係唔識寫字嘅人,都能夠直覺意識到「字詞」係啲乜。但係有關呢個概念具體嚟講要點界定,廿一世紀初嘅語言學界仲未有咩共識可言。有啲人主張字詞可以界定做「包含最少一個形態素、可以單獨噉存在嘅語言單位」,根據呢條思路,指「動作進行中」嘅就係一嚿形態素,但唔係一隻字詞,因為佢喺正常講嘢嗰時冇得單獨存在。根據呢種觀點,一隻字詞會有以下呢啲特徵[13][14]

  1. 一隻字詞會係對答嗰陣嘅最短可能答覆——
    「你有冇興趣讀語言學?」「有。」
    「你想嗌咩點心食呀?」「燒賣。」
  2. 如果一句句子要變,一隻字詞係「能夠郁動,同時郁咗又唔會搞到句嘢文法唔啱」嘅最細單位。
  3. 冇得透過加插音段或者短語成份嚟拆散,或者係「要再變長啲有難度」嘅單位當中係最大嘅。
  4. 一隻字詞入面啲形態素要有特定嘅次序,次序視乎語言而異,例如喺粵語入便,表示「進行中」嘅,一定要係掕喺動詞尾嘅,嘗試用緊游水嚟表達游緊水噉嘅意思係錯文法。

不過喺某啲語言當中,有人搵到有啲語言單位係「直覺上認為應該係一隻字詞,但冇得單獨存在」嘅[15]。除此之外,亦都有啲人主張要定義字詞,可以睇例如輕重讀嘅位置或者係一嚿物體喺文法上嘅角色[15]

有陣時,唔同嘅字詞定義仲可以彼此有衝突[16]:2.2.1:即係例如有一隻「字詞」,按文法睇(睇佢加前綴後綴嘅方式)算係一隻字詞,但係按音系字詞基準睇就應該當係兩隻字詞至啱。

註:字詞定義唔取決於書寫

响廿一世紀初嘅語言學上,要界定一隻字詞,係睇口語特性嘅,「呢個語言單位寫出嚟嗰陣係點」唔會影響佢算唔算係一隻字詞。

例如係音系字詞[e 7]嘅概念:音系字詞係指「按音系特徵嚟定義嘅字詞」[17];例如係英文噉,喺英文入面,每隻字詞都實有一個音節重音嘅,而好似 hot dog熱狗)噉,英式英文通常會係 hot 讀重音而 dog 就冇重音(想像大致似粵拼 hot1 dok4),喺呢種情況下,按音系字詞嘅觀點 hot dogdog 唔可以視為一隻字詞,而要算係 hot dog 呢一隻字詞嘅第二橛——縱使喺書寫上,啲人成日會搵個空格隔開 hotdog,令兩者望落似兩隻字詞[9]

因此,喺粵語嘅字典裡邊,好似係今日或者咖啡等嘅語言單位有可能被視為「字詞」——今日咖啡都係用咗兩隻漢字嚟寫,不過就算有一段嘢寫起上嚟用咗兩隻漢字,都唔等如段嘢可以當係有兩隻字詞。

詞位

編輯
内文:詞位
睇埋:原型理論

詞位[e 8]係構詞學上嘅一個重要概念。一隻語言入面嘅一個詞位會包含兩樣嘢[18]

  1. 一個語音,多音節又得,單音節都得;
  2. 一個相應嘅意思或者文法功能;
  3. 一個詞位嘅形態,可以視乎身處嗰句語句句法特徵而起變化(詞形變化)。而詞幹[e 9]就係指緊一個詞位當中「賦予嗰個詞位嘅意思、無論點做詞形變化都唔變」嗰一截[註 8]

舉個例說明,想像以下呢兩個唔同嘅粵語詞位(當中啲語音係用粵拼寫嘅)。兩個詞位嘅語音(1)一模一樣,但係相應嘅意思(2)唔同,所以要當係兩個唔同嘅詞位,字典會將佢哋分開當係兩個唔同嘅 item 噉嚟處理[註 9]

詞位 1 詞位 2
語音Faa1
漢字:花
意思名詞,指開花植物嘅生殖用構造,色水鮮艷形狀多變。
例句:你哋睇吓!成個公園啲花開晒!
語音Faa1
漢字:花
意思動詞,指付出或者第啲資源換取(例如)貨或者服務。
例句:我尋日花咗五百文,請我個姨甥女食自助餐

學習使用詞位並唔容易。學習者需要學相當大量嘅內隱知識,識得每隻字詞包含啲乜,同埋每隻字詞唔包含啲乜。舉例說明,好細個嘅細路(例如兩三歲嗰啲)就被指成日犯過度伸展過度限制[e 10]呢啲失誤:過度伸展係指過度「擴展」一隻字詞可以包含咩事物,而過度限制就係指過度「限住」一隻字詞可以包含咩事物;想像一個三歲細路,佢過度伸展可能係會用蝴蝶一詞嚟指晒所有嘅昆蟲,連蜜蜂都用蝴蝶一詞嚟稱呼,而佢過度限制就可能會誤以為蝴蝶一詞淨係包黑或者橙色嘅蝴蝶,唔識得用蝴蝶一詞嚟指其他色嘅蝴蝶[19]

字詞點變化

編輯

詞形變化[e 11]最基本上可以想像為「屬同一款詞位嘅字詞,因為要表達文法範疇而變樣」,當中文法範疇可以係隻動詞指嗰樣動作幾時發生隻名詞指嘅物體有幾多個或者係隻名詞係陰性定陽性... 呀噉[20][21]。好似粵語等嘅漢語被指傾向少詞形變化,但係歐洲語言就有唔少詞形變化,例如:

文法範疇 例語言 字詞變化
時態:個動作係幾時發生嘅? 英文 speak(講嘢現在式) → spoke(講嘢過去式
數量:名詞指嗰樣嘢,有幾多個? 英文 language(語言單數) → languages(語言眾數
:個名詞做緊句子邊部份? 拉丁文 rēx(國王主格) → rēgem(國王賓格

詞形變化同構詞衍生[e 12]係兩個好相似嘅概念。兩個概念都係講緊一隻語言嘅使用者將啲形態素「黐埋一齊」。用幾隻比較簡單嘅英文字詞做例嘅話,想像以下呢啲情況:

language → languages
(加 -s 變眾數)
talk → talked
(加 -ed 變過去式)
dance(動詞指跳舞) →
dancer(名詞指舞蹈員
Canton(名詞指廣州廣東) →
Cantonese(可作形容詞指粵式

當中前兩者屬詞形變化,而後兩者屬構詞衍生。籠統啲噉講,構詞衍生一般會引致一隻字詞意思「顯著改變」,可以令到隻字詞連詞性都唔同埋——例如 dance 可以係動詞或者名詞都得但 dancer 就實係名詞,而詞形變化就唔會有噉嘅情況—— talk 等嘅動詞就算變咗過去式,依然仲係動詞。除此之外,一隻字詞係咪要做詞形變化往往會受制於句法上嘅語境——例如一隻字詞係咪要變格,睇嘅係佢喺句子入便扮演咩角色,而構詞衍生就唔受制於呢啲嘢[6]:2.4

亦有研究者指,喺英文同日文等嘅唔少語言當中,做構詞衍生嘅詞綴傾向接近詞幹,而做詞形變化嘅詞綴就傾向離詞幹遠啲[6]:6.2。好似係英文啲形容詞,加 -ize 可以變動詞,表示... 化嘅意思——例如 popularize普及化噉解,而普及化第三身單數會係 popularizes-s 同詞幹之間隔咗 -ize)。

詞頭詞尾

編輯
内文:詞綴詞頭詞尾
睇埋:語音交替疊字

詞形變化可以想像成構詞句法特徵[e 13]嘅實現。喺好多語言裡便,詞形變化涉及詞綴[e 14],用詞綴表達構詞句法特徵。顧名思義,詞頭係指加喺詞幹前嘅詞綴,而詞尾就係指加喺詞幹後嘅詞綴。

最簡單係一個詞綴實現一種構詞句法特徵(兩者有一對一嘅對應),但係有時一個詞綴可以同時對應幾種特徵(累積型),或者係一個特徵對應幾個唔同嘅詞綴(延伸型)。拉丁文就有累積型嘅變化,例如指嘅動詞[6]:6.1.1

字詞 意思
amō 我愛現在式
amat 佢愛,現在式
amāmus 我哋愛,現在式
amor 我被愛,現在式

當中 表示隻字詞係現在式、主動語態單數第一人稱,就算句子入便冇代名詞,聽者都知句嘢係我愛嘅意思(而唔係我被愛或者我哋愛)——拉丁文齋靠一個詞綴,就表達好幾種構詞句法特徵[註 10]。而包括希臘文在內嘅多隻歐洲語言都有延伸型嘅情況。

一隻字詞嘅構詞句法特徵有時要配合其他字詞,例子有一致[e 15]或者格支配[e 16]嘅現象。

詞幹變樣

編輯

構詞句法特徵嘅實現,有陣時會透過元音變換[e 17]嚟做,即係指字幹當中嘅元音出現變化,而非喺隻字詞前面或者後面加啲嘢。呢種情況喺英文以及其他日耳曼語言當中好常見,例如以下呢幾隻常用嘅英文動詞[6]:6.3.2

意思 現在式 過去式 完成式
唱歌 sing sang sung
揸車 drive drove driven

有好多語言都有異幹互補[e 18]嘅情況,隻字詞嘅唔同形態望落完全唔同樣,例如英文

意思 現在式 過去式 完成式
go went gone

異幹互補之所以會出現,好多時係因為隻字詞嘅唔同形態詞源唔同。例如廿一世紀英文嘅 went 據考究嚟自中古英文wenden(可以具有離開或者轉向等嘅意思)——同 go 並唔係源自同一隻字詞。

根與規律

編輯

有關比較「另類」[註 11]嘅詞形變化或者構詞衍生方法,可以睇吓所謂嘅根與規律構詞[e 19]:如果話一隻語言採用根與規律構詞,即係佢一隻字詞嘅詞根淨係由若干個輔音組成,而啲輔音之間嘅元音(以及其他音節特性)就表示時態詞性等嘅資訊。即係想像好似以下噉[22]

b-n-k(名詞銀行嘅詞根) →
bank(單數,「一間銀行」) / bunuuk(眾數,「多間銀行」)
k-t-b(動詞書寫嘅詞根) →
katab-(過去式,主動,「某某人過去寫咗...」) / kutib-(過去式,被動,「某某本書過去被寫咗...」)

好多亞非語系[e 20]嘅語言都係用開根與規律構詞嘅。亞非語系主要分佈喺西亞北非嗰一帶,比較多人知嘅成員包括咗希伯來文(當中聖經希伯來文舊約聖經嘅書寫語言)、亞蘭文(據講係耶穌日常用嘅語言)同埋阿拉伯話等。

構詞句法學

編輯
内文:句法學

句法語言學另一個重要科目,專研究語句,尤其係講字詞點樣組合埋一齊形成語句。當中組合係一個重點關鍵字,例如試諗吓紅綠燈,紅綠燈都係表達緊一啲意思——紅燈表達停車黃燈表示就快行得綠燈表示行得喇,但呢啲符號並唔會話以唔同方式組合,意思會唔同咗,所以「紅綠燈話」唔算係語言[23]

構詞成日會同句法有互動。例如[24][25][26]

  • 文法格[e 21][27][28]:喺好多語言入便,名詞都可以做詞形變化嚟表示文法格;簡單講,話一隻名詞屬咩文法格,指嘅係隻字詞喺句子入便扮演乜嘢角色——係句子嘅主語抑或係賓語?英文缺乏文法格變化,而呢點被指解釋得到點解英文要有高度規律化嘅語序,啲句子近乎永世都係主語行先、動詞緊隨其後、賓語就跟尾[註 12]。有關有顯著文法格變化嘅語言,可以睇吓英文以外嘅日耳曼語言(例子有德文)或者係斯拉夫語言(例子有捷克話烏克蘭話)。
  • 詞性改變:構詞衍生可以令一隻字詞嘅詞性有所變化,詞性變咗就表示句法角色跟住改變;用粵語想像嘅話,醫治一般係做動詞,但做咗構詞衍生變醫治者,隻字詞就會變名詞,而佢喺句子入便嘅位置(典型嘅粵語句子係主語-動詞-賓語噉嘅)亦要跟住改變。
  • 一致特性[e 22]:指一隻字詞要做詞形變化,就住另一隻同佢相連嘅字詞。例如標準英文都有呢樣嘢[註 13],一隻動詞如果由一隻第三人稱嘅主語「做出」隻動詞就要變樣(主語動詞一致):
如果主語 S 係... 要變做... 例句
I第一身單數 eat I eat...我食...
You或者你哋第二身 eat You eat...你食...
He/she第三身單數 eats He eats... / She eats...佢食...
  • 句法限制構詞[6]:7:一句嘢嘅句法結構,仲可以限制句嘢啲字詞可以做邊啲構詞變化,例如有啲語言會出現一種情況,就係啲動詞要喺文法性別上夾返佢哋嘅名詞,但係如果句嘢係過去式就唔使噉做。

等等。

影響埋詞庫

編輯
粵語詞庫其中一樣嘢
語音Fo2粵拼
漢字
意思名詞,物件燃燒嘅現象,會釋放大量嘅
例句:快啲郁手生火啦!我哋成班人等住 BBQ 呀!
内文:詞庫新詞詞庫化

詞庫[e 23]係指一隻語言裡便嗰啲詞彙嘅總和。例如粵語嘅詞庫包晒所有粵語口語有機會使用嘅詞彙——例如

叉燒包caa1 siu1 baau1

呢隻字詞粵語口語會用到,可以算係粵語詞庫嘅一部份[註 14]。除此之外,(例如)用同一隻語言但年紀唔同嘅人,用嘅字詞可能都唔多同,有陣時啲人可以齋靠聽一個人講嘢嘅用詞,就可以斷定佢嘅年齡[29]

新詞[e 24]定義上係詞庫演變嘅一種,喺語言學上係語言演變嘅重要一部份。新詞嘅形成,好多時都係源自隻語言嘅使用者靠住各種構詞機制創造出新字詞嘅。例如[30]

  • 詞綴化[e 25]:創造新詞嘅一種簡單方法,就係同已有字詞加一啲之前唔會加嘅詞綴詞頭詞尾都得);不過好多語言都會對「詞綴可以點樣黐法」設下一啲限制[註 15]
  • 混成詞[e 26]:由兩隻字詞嗰度各攞一橛,再拼埋一齊形成一隻新字詞,例如英文字詞 spork 係指叉羹噉解,當中隻字詞源自 spoon匙羹)嘅 sp-fork餐叉)嘅 -ork 拼埋一齊而成嘅。
  • 逆成詞[e 27]:攞住一隻現有嘅字詞,攞住隻字詞「望落似詞綴」嗰一截,形成一隻新字詞;例如有英文史嘅考究發現,edit(指編輯嘅舉動)呢隻字詞查實出現得遲過 editor(指從事編輯嘅人),而隻詞被指係因為啲人攞走 editor 嗰個 -or (似詞綴指... 者)而形成嘅。

等等。上述呢啲創造字詞嘅機制,可以想像成

輸入 輸出
詞位 1 詞位 2
editor edit

噉嘅過程[31]

影響返音系

編輯

一隻字詞嘅構詞特性,往往能夠影響佢嘅音系特性。

同化[e 28]係講緊兩段相鄰嘅音段互相影響,其中一個音段喺某啲特徵上似咗另外嗰個,因而令到兩個音段變得更相似。例如喺英文入面,一隻動詞變過去式要加 /d/ 喺尾,但如果前面嗰個音節係濁音,表示過去式嘅 /d/ 往往就要變成 [t]。除咗噉,一隻字詞起構詞變化(例如係做詞形變化),可能會令佢觸犯隻語言嘅語音組合規律,所以隻字詞就要發音變化,就返呢啲語音組合規律[32]

漢語當中就有所謂嘅形態素變調現象。形態素變調講緊一個形態素嘅聲調喺某啲語境或者意思下要改變,變到同單獨噉讀嗰陣唔同。呢種現象尤其常見於一隻合成詞最尾嘅音節。用廿一世紀初嘅粵語做例子,粵語嘅形態素變調被指通常出現喺語義上同細小嘅嘢、食物、疾病相關嘅字詞[33][34],通常都係由比較低音嗰啲聲調(3 4 5 6)變做高音啲嘅 1 2 [34]:p 2。以下係一啲被指有形態素變調情況嘅香港粵語字詞:

原字 正常讀音 變調例子 點變法?
waan4 耳環(ji5 waan2 4 → 2
jan4 男人(naam4 jan2 4 → 2
neoi5 港女(gong2 neoi2 5 → 2
maan5 今晚(gam1 maan1 5 → 1
mei5 包尾(baau1 mei1 5 → 1

唔少喺粵語周圍嘅漢語都有噉嘅現象,例子有台山話,仲有係客家話嘅某啲方言呀噉[35]

又例如係英文啲重讀[e 29]噉,英文字詞嘅詞尾被指可以分做兩大種:一種係會引致輕重讀規律起變化嘅,而另一種就唔會引致輕重讀規律起變化。例如一隻英文字詞如果加 -ian 做尾,就會令到隻字詞重音嘅位唔同咗[36]

運算概念

編輯

教電腦處理語言構詞,會用到以下呢啲概念:

  • 詞形還原:教部電腦學識「一隻字詞可以做詞形變化」,令到電腦識得將呢啲唔同樣當做同一隻字詞噉嚟分析;例如英文 househouses 都係名詞指,後者係眾數,做詞形還原就會教部電腦知 househouses 係同一隻字詞嘅唔同款[37]
  • 詞幹提取:部電腦攞一隻經過詞形變化嘅字詞做 input(例如 houses),跟住畀出隻字詞嘅詞幹做 output(例如 house[38]。處理英文嗰陣,好似詞形還原同詞幹提取等嘅作業相對簡單,不過例如俄羅斯文或者拉丁文就會撈絞好多——呢啲語言有極複雜嘅詞形變化,可能一段詞綴表達好幾種唔同嘅文法意思[註 10]
  • 詞性標注:部電腦攞一段文本做 input,再畀出個 output,同段文本入面每隻字詞標明佢屬於乜嘢詞性,每隻字都標明咗佢係名詞定係動詞定係點。舉例說明,想像家陣個 input 係以下嘅粵文語句[39]
    佢喺街市賣生果
    做咗詞性標注,個 output 就會類似以下噉樣:
    佢 (pronoun) 喺 (in) 街市 (noun) 賣 (verb) 生果 (noun)。

等等。

仲可以睇

編輯
  • 構詞類型語言類型學嘅一部份,按照構詞嘅方式將語言分類做分析語綜合語等嘅類型[40]。順帶一提,粵語等嘅漢語喺構詞類型上偏向分析語。
  • 原型理論:呢套理論可以用嚟解釋人類點樣判斷「呢嚿物體,係咪屬於呢隻字詞所包含嘅範圍之內」。簡單講,人腦做嘅呢種判斷,可以想像成「攞面前嗰件物體,同心目中嘅典型對比」噉樣嘅過程。
  • 構詞整平:一種語言演變現象,指一隻語言當中一條詞形變化法則普遍化嘅情況[41]——例如英文啲名詞變眾數,通常係要後面加 /s/ 或者類似嘅音嘅(一條詞形變化法則),廿一世紀有啲英文字詞唔跟呢條法則,例如男人(單數定眾數都係 /man/)噉,如果英文演變到男人變眾數要加 /s/ 嘅話,就可以算係出現咗構詞整平嘅情況[42]
  • 直接相關嘅語言學學科:音系學 · 句法學 · 語義學
  • 生產率
  • 文法範疇
  • 資訊理論

學術文獻

編輯

英文文獻:

參考

編輯

註釋:

  1. 根據 item-and-process 觀點構詞係「將詞位轉化」。
  2. 所以使用助動詞唔算詞形變化。
  3. 發音:講緊以音素計。
  4. 縱使呢幾嚿嘢都係用咗同一隻漢字寫出嚟。
  5. 分佈上冇重疊:一個出現嘅話,另一個就一定唔會出現。
  6. 頭兩者喺音素上並唔同,係清音濁音之別,但係由於書寫上嘅限制,寫英文嗰時都係以加個 -s 做尾嚟呈現。
  7. 可以睇吓隱密型嘅概念。
  8. 喺某啲語言當中,一個詞位可以有多個詞幹,例子有拉丁文
  9. 詞位好多時都未能夠清楚界定,例如一個詞位可以有好幾個相似嘅意思,但呢幾個意思又唔完全一樣。例子:走咗喺粵語入便可以係指離開,但又可以係指死亡。可以睇睇一詞多義嘅概念。
  10. 10.0 10.1 可以睇睇屈折語嘅概念。
  11. 另類:講緊由粵港澳地區嘅人嘅角度睇
  12. 事實係有研究指,一隻語言構詞系統嘅複雜程度,同佢嘅語序規律程度有負相關。有豐富文化格變化嘅語言,可以唔使用定死咗嘅語序嚟清楚表達意思。
  13. 多數歐洲語言都有。
  14. 縱使呢隻字詞用漢字寫嗰陣未必係粵文獨有。
  15. 呢啲限制,母語使用者未必有能力明文講出嚟(內隱知識)。

文中重要詞彙嘅外語(主要係英文)版:

  1. linguistic morphology
  2. bound morpheme
  3. free morpheme
  4. clitic,嚟自希臘文 ἐγκλιτικός / enklitikós,大致係倚靠住噉解。
  5. IPA
  6. allomorph
  7. phonological word
  8. lexeme,近似 lek1 sim4
  9. lexical stem
  10. overextension and underextension
  11. inflection
  12. derivation
  13. morphosyntactic feature
  14. affix
  15. agreement;一隻字詞同第隻字詞喺構詞句法特徵上「同化」咗。
  16. case government;想像一隻動詞限制咗佢周圍嘅名詞可以係咩文法格,但係動詞本身冇文法格。
  17. apophony
  18. suppletion
  19. root-and-pattern morphology
  20. Afroasiatic languages
  21. case
  22. agreement,agr
  23. lexicon,近似 lek1 sik4 kan4
  24. neologism
  25. affixation
  26. portmanteau
  27. back-formation
  28. assimilation
  29. stress

文中引述咗嘅引用來源:

  1. linguistic morphology不列顛百科全書,引咗嗰段:"Morphology, in linguistics, study of the internal construction of words."
  2. What is a Word?. SIL Glossary of Linguistic Terms.
  3. Haspelmath, Martin; Sims, Andrea D. (2002). Understanding Morphology. London: Arnold. p. 15.
  4. Schleicher, August (1859). "Zur Morphologie der Sprache". Mémoires de l'Académie Impériale des Sciences de St.-Pétersbourg. VII°. Vol. I, N.7. St. Petersburg. p. 35.
  5. morpheme. Online Etymology.
  6. 6.0 6.1 6.2 6.3 6.4 6.5 Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons.
  7. Haspelmath, Martin (2010). Understanding Morphology. Andrea D. Sims (2nd ed.). London: Hodder Education.
  8. affixes. Learn Cantonese.
  9. 9.0 9.1 Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 2.3.1 Phonological words,佢呢度有提到 "Elements that are written as separate words but do not have their own stress are therefore not phonological words in English."
  10. Nida, E. A. (1949). Morphology: The descriptive analysis of words. University of Michigan Press,呢本係一本幾出名嘅教科書
  11. Lam, C. F. (2009). A Comparison between the Cantonese Aspect Markers gan and haidou (PDF). Rivista di Grammatica Generativa, vol. 34 (2009), p. 87-113,呢篇英文論文探討粵語點樣用喺度嚟表達文法體,呢度引咗嘅係佢 "1. Gan and haidou as aspect markers in Cantonese" 嗰一部份。
  12. Aikhenvald, A. Y., Dixon, R. M., & White, N. M. (Eds.). (2020). Phonological word and grammatical word: A cross-linguistic typology (Vol. 10). Oxford University Press, USA,佢呢度講咗 "'Word' has 'psychological reality' for speakers, enabling them to talk about the meaning of a word, its appropriateness for use in a certain social context, and so on."
  13. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 2.2
  14. What is a Word?. GLOSSARY OF LINGUISTIC TERMS.
  15. 15.0 15.1 Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 2.1,佢哋呢度講到
    • 英文入面嘅 my 直覺上認為算係一隻字詞,但唔能夠單獨存在。
    • 有關輕重讀嘅位置,佢哋提到法文出晒名永遠係一隻字詞最尾音節重讀,以及現代希臘文重讀永遠係喺隻字詞最尾嗰三個音節嘅其中一個嗰度。
  16. Riemer, N. (2010). Introducing semantics. Cambridge University Press.
  17. Matthews, P. H. (2014). The concise Oxford dictionary of linguistics. Oxford University Press, USA. "Phonological word"
  18. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 2.3.3 Lexemes.
  19. Gruendel, J. M. (1977). "Referential Extension in Early Language Development". Child Development. 48 (4): 1567-1576.
  20. inflection不列顛百科全書,佢講咗呢段:"Inflection, in linguistics, the change in the form of a word (in English, usually the addition of endings) to mark such distinctions as tense, person, number, gender, mood, voice, and case."
  21. Hayes, B. P. (2010). Introductory linguistics 互聯網檔案館歸檔,歸檔日期2023年3月4號,. (PDF). Unpublish textbook,尤其係睇 2.4 "Breaking up the words into morphemes" 嗰段,講一隻做咗詞形變化嘅字可以𢱕散做多隻 morpheme
  22. root and pattern system不列顛百科全書
  23. Mark R. B. Intro. to Syntax Lecture Notes. NYU Arts & Science.
  24. Anderson, S. R. (1992). A-morphous morphology. Cambridge University.
  25. Dufter and Stark (2017) Introduction – 2 Syntax and morphosyntax: some basic notions in Dufter, Andreas, and Stark, Elisabeth (eds., 2017) Manual of Romance Morphosyntax and Syntax, Walter de Gruyter GmbH & Co KG.
  26. Emily M. Bender (2013) Linguistic Fundamentals for Natural Language Processing: 100 Essentials from Morphology and Syntax, ch.4 Morphosyntax, p.35, Morgan & Claypool Publishers.
  27. Corbett, Greville G.; Noonan, Michael (2008). Case and Grammatical Relations: Studies in honor of Bernard Comrie. Amsterdam/Philadelphia: Jhn Benjamins Publishing Company.
  28. Blake, B. J. Case. Cambridge University Press: 2001.
  29. Lai, R., & Winterstein, G. (2020, May). Cifu: a frequency lexicon of Hong Kong Cantonese. In Proceedings of the Twelfth Language Resources and Evaluation Conference (pp. 3069-3077).
  30. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 4.2,呢道有講到幾種創造新字詞嘅方法。
  31. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 4.3,呢道仲有對英文作出分析,用咗 reinterpretation 等嘅字詞講到英文嘅呢啲構詞方式會「分層」。順帶一提,呢種情況有時可以造成歧義
  32. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 3.1 Allomorphs.
  33. Yip, Virginia; Matthews, Stephen (2000). Intermediate Cantonese: A Grammar and Workbook. London, UK: Routledge.
  34. 34.0 34.1 D Jurafsky "On the semantics of Cantonese changed tone or women, matches, and Chinese broccoli" (PDF), Proceedings of the 14th Annual Meeting of the Berkeley Linguistics Society. Berkeley: Berkeley Linguistics Society.
  35. Chappell, Hilary (September 2023). "Tone Morphemes in Sinitic: Where Prosody Meets Morphology". Journal of Chinese Linguistics.
  36. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 3.3 Primary and Secondary Affixes,亦有提到一樣嘢,話「會令字詞重音部份移位」嘅詞尾傾向係借自羅曼語言嘅。有關英文喺歷史上點樣受羅曼語言影響,可以睇吓英文史嘅嘢。
  37. Müller, Thomas; Cotterell, Ryan; Fraser, Alexander; Schütze, Hinrich (2015). Joint Lemmatization and Morphological Tagging with LEMMING. 2015 Conference on Empirical Methods in Natural Language Processing. Lisbon: Association for Computational Linguistics. pp. 2268-2274.
  38. Frakes, W. B. (1992); Stemming algorithms, Information retrieval: data structures and algorithms, Upper Saddle River, NJ: Prentice-Hall, Inc.
  39. NLP Guide: Identifying Part of Speech Tags using Conditional Random Fields. Medium.
  40. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. Ch. 8 "a. Though many things are possible in morphology, some are more possible than others.
    b. Though there are infinitely many potential words in a language, some are more likely to become actual words than others."
  41. Albright, A. (2005). The morphological basis of paradigm leveling (pp. 17-43). na.
  42. Garrett, A. (2008). Paradigmatic uniformity and markedness. Linguistic universals and language change, 125-143. 2 Middle and Modern English 嗰個章節(第 5 頁)講到英文嘅 leveling 例子。
  43. Aronoff, M., & Fudeman, K. (2022). What is morphology?. John Wiley & Sons. 2.5 Two Approaches to Morphology: Item-and-Arrangement, Item-and-Process.

外拎

編輯