ROUGE (評估準則)

ROUGE（Recall-Oriented Understudy for Gisting Evaluation）係自然語言處理上一類做法，用嚟評估一段自動總結或者機翻演算法「有幾好」。

諗頭

ROUGE 嘅基本諗頭係，人工智能最想做嘅嘢就係教電腦模仿人噉嘅智能，所以如果話一段 AI 演算法掂，即係等同話佢展現到同人類專家一樣噉嘅表現；噉講即係話，研究者會去^[1]

搵一拃由受過訓嘅人類，叫佢哋人手同拃文件做總結；
用自己設計嘅自動總結演算法同同一拃文件做總結；
比較人類專家做嘅總結同段演算法做嘅總結；
兩者愈相似，就愈表示段演算法掂。

睇埋

攷

↑ Lin, C. Y. (2004, July). Rouge: A package for automatic evaluation of summaries (PDF). In Text summarization branches out (pp. 74-81).

呢篇同AI相關嘅文係楔位文。歡迎幫維基百科擴寫佢。

由「https://zh-yue.wikipedia.org/w/index.php?title=ROUGE_(評估準則)&oldid=1868893」收