文獻計量學
文獻計量學(粵拼:man4 hin3 gai3 loeng4 hok6;英文:Bibliometrics)係指用統計方法嚟分析書同第啲出版物。
應用
編輯廿一世紀初嘅語言學,好多時都會借用統計概念。想像家陣有位語言學研究者,佢想比較唔同時期嘅港產片啲粵語對白有乜嘢分別,佢可以揸住手上嘅文獻或者口語紀錄,由幾個角度剖析段嘢,計吓唔同嘢嘅頻率,例如[1]:1.2:
- 字符:標點符號或者空格嘅使用;
- 字詞:詞彙嘅多變度、用嘅傾向係常見字定係少見字;
- 句子:句子幾長、句子嘅規律(例如會唔會某啲語序常見啲?);
- 段落:段落長度、段落用乜嘢類型嘅字開頭、段落用乜嘢類型嘅字終結;
- 文法:詞性嘅 n-gram;
- 語義:會唔會某啲語義類型嘅字詞常見啲?
呀噉。
研究者跟住就可以郁手做比較,睇吓唔同時期嘅作品嘅粵語對白响呢啲特性嘅頻率同分佈上有咩差異[2]。有關具體要用邊啲統計分析,簡單嘅可以睇 t 測試同 ANOVA。進階啲嘅可以睇因素分析同聚類分析。
睇埋
編輯引咗
編輯- ↑ Liu, Y., & Xiao, T. (2020). A stylistic analysis for Gu Long's Kung Fu novels. Journal of Quantitative Linguistics, 27(1), 32-61.
- ↑ Burrows, J. F. (1987). Word-patterns and story-shapes: The statistical analysis of narrative style. Literary & Linguistic Computing, 2(2), 61-70.