ROUGE (評估準則)
ROUGE(Recall-Oriented Understudy for Gisting Evaluation)係自然語言處理上一類做法,用嚟評估一段自動總結或者機翻演算法「有幾好」。
諗頭
編輯ROUGE 嘅基本諗頭係,人工智能最想做嘅嘢就係教電腦模仿人噉嘅智能,所以如果話一段 AI 演算法掂,即係等同話佢展現到同人類專家一樣噉嘅表現;噉講即係話,研究者會去[1]
- 搵一拃由受過訓嘅人類,叫佢哋人手同拃文件做總結;
- 用自己設計嘅自動總結演算法同同一拃文件做總結;
- 比較人類專家做嘅總結同段演算法做嘅總結;
- 兩者愈相似,就愈表示段演算法掂。
睇埋
編輯攷
編輯- ↑ Lin, C. Y. (2004, July). Rouge: A package for automatic evaluation of summaries (PDF). In Text summarization branches out (pp. 74-81).