三及第
三及第(粵拼:saam1 kap6 dai2;國際音標:[saːm˥ kʰɐp̚˨ tɐi̯˧˥])係一種夾雜文言、書面語(基於標準官話嘅白話文)同埋廣東話嘅一種書寫文體。三及第早就嚮清朝出現,好似係招子庸作嘅粵謳,又或者邵彬儒作嘅《俗話傾談》都係用三及第嚟作嘅。[1]而呢種三及第喺 1940年代至到 1960年代嘅香港新聞紙好流行[2]。早期廣州新聞紙亦有[3],個作者可以隨意嚮一篇文用呢種文體嚟達到唔同嘅效果,用文言令讀者覺得格外嚴肅,用國語就較之為中性,用廣東話就覺得親切、市井。
問題
編輯睇埋:低資源語言
如果攞三及第噉嘅文字當做粵語語言資源嚟訓練 AI 學粵語,就會出好似以下噉「唔鹹唔淡」嘅 output [4]:
- Output:「有一日,一只雞跟一隻兔兩兄弟把車開去自己屋企。突然間車就壞咗。」
- 純中文書面語:「有一天,一只雞跟一只兔兩兄弟把車開去朋友家。突然間車就壞了。」
- 純粵語白話文:「有一日,一隻雞同一隻兔兩兄弟揸車去朋友屋企。突然間架車就壞咗。」
例子
編輯人物
編輯(參考來源:[5])
引咗
編輯- ↑ https://hub.hku.hk/bitstream/10722/199783/1/Content.pdf
- ↑ Cantonese as Written Language, p127, Don Snow, Hong Kong Univsersity Press, ISBN 978-962-209-709-4
- ↑ 〈「三及第」文體〉。原著喺2016年3月4號歸檔。喺2008年6月2號搵到。
- ↑ 大語言模型點樣令廣東話走出低資源語言嘅惡咒
- ↑ 〈琴台客聚:粵語文學兩大將〉。原著喺2014年1月9號歸檔。喺2010年9月24號搵到。