User:Dr. Greywolf/Sandbox4
要貼去:
Factor analysis
--wk--
--wk--
Falsifiability - as attachment | 損失規避
--wk--
--far future--
展望理論 && Cumulative prospect theory (maybe combine some of these) | 信念函數理論 | 買家決策過程
最小最大化 編輯
最小最大化(粵拼:zeoi3 siu2 zeoi3 daai6 faa3;英文:minimax / minmax)係一種博弈論上講到嘅策略,喺人工智能等嘅領域嗰度都成日提及。如果話一個個體採用最小最大化嘅方式嚟做決策,意思係話佢會盡力噉將自己嘅最小最大化,盡量令自己嘅最低報償值有咁大得咁大。用日常用語講,呢種決策方式係想時刻確保自己嘅最小得益有咁大得咁大,同時又時刻確保自己嘅最大損失有咁細得咁細。
基礎 編輯
最大最大化 編輯
阿 B 出紅 | 阿 B 出藍 | |
---|---|---|
阿 A 出紅 | 0, 0 | 0, 0 |
阿 A 出藍 | 0, 1,000 | 1,000, 0 |
首先,思考吓最大最大化(maximax)策略—「將自己嘅最大可得最大化」。依家想像一場零和遊戲,兩位博弈者,佢哋各自手上揸住一張藍色嘅咭同一張紅色嘅咭,淨係自己睇到,佢哋要同時噉將一張咭擺上檯面,遊戲規則如下:
- 如果 A 君出咗紅咭,無論 B 君出邊張咭都好,場博弈打和。
- 如果 A 君出咗藍咭嘅話...
- 如果 B 君出紅咭,噉 B 君贏 1,000 文港紙。
- 如果 B 君出藍咭,噉 A 君贏 1,000 文港紙。
呢場博弈嘅報償矩陣,係好似表 1 噉嘅樣。當中 (x, y) 嘅結果表示 A 君贏 x 文而 B 君贏 y 文。假如 A 君跟從最大最大化嘅法則行事,佢會永遠選擇出藍咭:對佢嚟講,出紅咭嘅最大可得係 0,而出藍咭嘅最大可得係 1,000 文港紙,後者能夠令到「最高可以得到幾多報償」呢個數值最大化。問題係,如果 A 君跟從噉嘅法則行動,B 君就有著數—— B 君可以選擇永遠出紅咭,噉就會永遠都贏錢。一般認為,最大最大化冇考慮到對手會點樣反應,所以本質上就係唔理性嘅,只有天真嘅決策者(例如細路)先會採取噉嘅策略[1]。
算法 編輯
應用 編輯
局制 編輯
參見 編輯
引咗 編輯
外拎 編輯
損失規避 編輯
損失規避(粵拼:syun2 sat1 kwai1 bei6;英文:loss aversion)喺認知心理學上指人偏向鍾意避免損失多過得到同等嘅得益嘅傾向。
基本概念 編輯
損失規避係人類嘅一種經濟行為傾向,硬係覺得損失好似影響大啲噉,損失 X 文慘嘅程度大過得到 X 文嘅開心程度;損失規避令人有種傾向,想出盡全力避免損失。
喺一個展視損失規避嘅實驗當中,研究者可以去搵一柞受試者返嚟玩一啲買賣遊戲,途中問佢哋(例如)寧願賺多 10 文定係避免損失 10 文,結果多數係發現啲受試者通常都會揀後者-引證咗損失規避嘅假說[1]。
非人研究 編輯
進化解釋 編輯
局限 編輯
應用 編輯
睇埋 編輯
引述 編輯
- ↑ Kahneman, D. & Tversky, A. (1992). "Advances in prospect theory: Cumulative representation of uncertainty". Journal of Risk and Uncertainty. 5 (4): 297-323.
文獻 編輯
- Toh, W. (2021). The economics of decision-making in video games. Game Studies, 21(3).