同義詞
同義詞(粵音:Tung4 ji6 ci4;英文:Synonym),又或者叫同義異形,就係指意思一樣嘅字詞、形態素或者短語,而近義詞就係指意思非常相似嘅字詞。同義詞好常見,全世界各種嘅話都有呢種現象。例如喺粵語裡邊,固執、頑固同埋死牛一面頸意思好接近,最低限度屬於近義詞[1]。
其他粵語例子:
- 接近 - 近似 - 相似 - 差唔多
- 自大 - 懶叻 - 自負 - 招積 - 「寸」- 懶巴閉 - 不可一世 - 目中無人 - 沙塵
喺語言學上,同義詞呢家嘢吸引咗唔少人研究:語義學(語言學下嘅學科,專研究語言點樣表達意思)就成日都會討論同義詞嘅概念;除此之外,同義詞嘅存在甚至仲有可能反映一種語言嘅歷史。
基本概念
編輯响廿一世紀初嘅語言學上,要識別兩個字詞係咪同義詞,一個常用方法係檢查兩個詞係唔係可以互相替換[2]。如果 A 同 B 係同義詞,噉喺任何句子入面將 A 換做 B,或者將 B 換做 A,句子嘅意思都應該唔會改變。粵語例子:
- 「佢份人好頑固。」改做
- 「佢份人好死牛一面頸。」
之後,句嘢嘅意思冇乜大變化。
不過,事實證明,可替換並唔係簡單嘅「是否」問題。就算兩個詞喺某啲情況可以互換,都可能有其他情況係唔可以互換嘅。呢種現象可能係因為兩個詞喺聯想意思或者詞義等方面有微妙嘅差別[3],例如:
- 聯想意思[4]嘅分別:就算兩個詞嘅字面意思相同或者好相似,佢哋嘅聯想意思都可能好唔同。例如苗條同瘦都係形容一個人體重輕,但係苗條有正面含義,通常係讚美一個人體重輕但身材好[5]。相比之下,瘦喺粵語入面可能會令人聯想到瘦蜢蜢(即係瘦得好似有病,甚至似營養不良)噉嘅負面意思[6]。所以喺某啲語境入面,苗條同瘦就唔可以互換,例如:
- 「你個孫生得咁瘦,係咪營養不良呀?」(如果喺呢句入面將瘦換做苗條,聽起上嚟會好奇怪)
- 詞義[7]嘅分別[8]:p 30:假設有 A 同 B 兩個詞,A 可能有幾個唔同嘅詞義,而只有部分詞義同 B 係同義。呢種情況喺英文入面好常見,例如英文詞 chest 同 box 做名詞嗰陣都可以係指某啲類型嘅箱,但係做名詞嘅 chest 仲有另一個詞義,就係指心口[9],而 box 並冇噉嘅詞義,所以諗諗以下嘅例句:
- 「我用個 chest 裝住咗啲錢。」(呢句入面嘅 chest 通常可以換做 box。)
- 「我個 chest 有啲痛,唔知係咪心臟有問題。」(呢句入面嘅 chest 應該就唔可以換做 box。)
語言學界研究過好多種語言,檢驗字詞之間嘅可替換程度,發現除非係好專業嘅對話(例如講科學或者法律嘢嘅時候),否則完美同義幾乎係唔可能存在嘅[註 1]。絕大多數情況下,一對同義詞只可以達到「喺大部分語境入面可以互換」嘅程度[10]。
反映歷史
編輯喺好多種語言入面,借詞[11]都係同義詞嘅一大來源,而呢點往往反映一種語言嘅歷史。
例如英文喺呢方面就幾出名[12]。英文屬於日耳曼語言[13],但係喺英文史上,英文因為諾曼人征服英格蘭等嘅事件而一路深受法文同拉丁文等嘅羅曼語言[14]影響,由羅曼語言嗰度借咗好多字詞[註 2],例如
廿一世紀英文 拉丁文源字詞 Bishop,主教 Episcopus,指「主教」[15] Hymn,聖詩 Hymnus,指「讚美歌」[16] Assist,幫助 Assistere,可以係「幫助」噉解[註 3][17]
——但係同時本土英文嘅 help(出自日耳曼語言)意思同 assist 近乎一樣咁滯。古代嘅英格蘭人,明明自己本土語言有字詞,依然選擇由拉丁文借隻字詞過嚟,就令到英文有咗一對同義詞[註 4]。除咗幫助之外,廿一世紀初英文仲有大把噉樣嘅同義詞,例如係作答同痛楚呀噉。
借詞引致同義詞呢種現象,就算喺東亞都可以見得到。日文、韓文同越南文歷史上都成日由漢語嗰度借詞。例如日文就深受中古漢語影響,好多時自己本土語言會有一隻字詞,同時喺出自漢語嘅字詞當中又會搵到隻同義詞[18][19]:好似係日文漢字水,起碼有兩個可能嘅讀音—— mizu 同 sui,前者係訓讀[20]音,而後者係漢音,漢音可見於例如
- 水曜日(日羅係 suiyobi)
等嘅特定字詞;訓讀音係日本人用自己本土口語字詞讀漢字形成嘅讀音,而漢音就係跟漢語讀嘅發音,兩隻字詞表示嘅意思大致一樣,都係指水。
喺伊斯蘭世界,阿拉伯文(可蘭經原版就係用古典阿拉伯文寫嘅)同波斯文(伊朗喺歷史上不溜都好有影響力)都被指係同義借詞嘅一大來源。
運算做法
編輯教人工智能處理語言嗰陣,可以有好多方法教電腦自動噉處理同義詞[21]。
- 睇字詞嘅分佈:教電腦睇大量用目標語言寫成嘅文本,留意文本入面啲字詞嘅語境特性(例:睇勻晒咁多語句,會唔會有某兩個字詞係成日可以互換嘅呢?)從而搵出邊啲字詞似係同義詞。詳情亦可以睇睇語料庫同大型語言模型方面嘅技術。
- 睇語句嘅樣式:電腦可以睇大量文本,留意一隻語言入便嘅某啲常見句子模式嚟搵出同義詞,譬如甲,又有個名叫乙或者甲又可以稱為乙等嘅句式,都表示甲同乙好可能係同義詞。包括上位詞同下位詞等嘅詞彙關係,都可以用呢種方法嚟搵。
- WordNet:好似 Wordnet 噉嘅語義網絡,會描述字詞之間有咩語義關係,例如貓係一種動物、貓有毛皮、動物有細胞等嘅關係,而且呢啲語義網絡仲要係整到電腦可以輕易讀取嘅,方便電腦自動噉摷[22]。
- 靠索引典[23]:研究者亦可以靠現成嘅索引典——索引典紀錄咗一隻語言入便邊啲字詞係近義嘅,研究者可以索性叫電腦自己去查索引典,假設佢嘅目標語言有現成索引典,而且啲索引典整咗做佢部電腦查得嘅網上資源。
- 潛在語義分析(LSA):自然語言處理技術,有方法將啲字詞縮做低維度嘅向量(簡化講,就係轉化成數值)。可以睇吓詞嵌入嘅概念。
... 等等。
相關概念
編輯睇埋
編輯註釋
編輯引咗
編輯- ↑ 死牛一面頸,粵典
- ↑ 可以互相替換:substitutable
- ↑ Edmonds, P., & Hirst, G. (2002). Near-synonymy and lexical choice. Computational linguistics, 28(2), 105-144.
- ↑ 聯想意思:connotation
- ↑ 苗條
- ↑ 瘦
- ↑ 詞義:word sense
- ↑ Murphy, M. Lynne. 2003. Semantic relations and the lexicon. con. Antonymy, synonymy and other paradigms. Cambridge: Cambridge University Press.
- ↑ chest. Cambridge Dictionary.
- ↑ Ullmann, Stephen. 1972. Semantics: an introduction to the science of meaning. Oxford: Blackwell. p. 141-142
- ↑ 借詞:loanword
- ↑ Bradley, Henry (1922). The Making of English. Macmillan and Company, Limited.
- ↑ 日耳曼語言:Germanic languages;德文、荷蘭文同丹麥文都屬於日耳曼語言。
- ↑ 羅曼語言:Romance languages;意大利文、西班牙文、加泰隆尼亞文同葡文都係羅曼語言。
- ↑ Bishop. Etymology Dictionary.
- ↑ Hymn. Etymology Dictionary.
- ↑ Assist. Etymology Dictionary.
- ↑ 「音読、訓読」的差異及使用時機? (香港繁體)
- ↑ 【分かりやすい】音読みと訓読みの区別【見分け方】
- ↑ 訓讀,日文叫 kun'yomi
- ↑ Trappey, A. J., Trappey, C. V., Wu, J. L., & Tsai, K. T. C. (2019). Using machine learning approach to identify synonyms for document mining. In Transdisciplinary Engineering for Complex Socio-technical Systems (pp. 509-518). IOS Press. 1.3 Synonym extraction
- ↑ Fellbaum, Christiane; Vossen, Piek (2012). "Challenges for a multilingual wordnet". Language Resources and Evaluation. 46 (2): 313-326.
- ↑ 索引典:thesaurus
連結
編輯- (英文) Thesaurus.com,一個好多人用嘅網上英文索引典