要貼去:

Factor analysis

--wk--

最小最大化

--wk--

Falsifiability - as attachment | 損失規避

--wk--

夾公仔機

--far future--

展望理論 && Cumulative prospect theory (maybe combine some of these) | 信念函數理論 | 買家決策過程

en:Yes and no






最小最大化 編輯

最小最大化粵拼zeoi3 siu2 zeoi3 daai6 faa3英文minimax / minmax)係一種博弈論上講到嘅策略,喺人工智能等嘅領域嗰度都成日提及。如果話一個個體採用最小最大化嘅方式嚟做決策,意思係話佢會盡力噉將自己嘅最小最大化,盡量令自己嘅最低報償值有咁大得咁大。用日常用語講,呢種決策方式係想時刻確保自己嘅最小得益有咁大得咁大,同時又時刻確保自己嘅最大損失有咁細得咁細。

基礎 編輯

睇埋:馮紐曼

最大最大化 編輯

表 1:出紅咭定出藍咭好?
阿 B 出紅 阿 B 出藍
阿 A 出紅 0, 0 0, 0
阿 A 出藍 0, 1,000 1,000, 0

首先,思考吓最大最大化(maximax)策略—「將自己嘅最大可得最大化」。依家想像一場零和遊戲,兩位博弈者,佢哋各自手上揸住一張藍色嘅咭同一張紅色嘅咭,淨係自己睇到,佢哋要同時噉將一張咭擺上檯面,遊戲規則如下:

  1. 如果 A 君出咗紅咭,無論 B 君出邊張咭都好,場博弈打和。
  2. 如果 A 君出咗藍咭嘅話...
    • 如果 B 君出紅咭,噉 B 君贏 1,000 文港紙
    • 如果 B 君出藍咭,噉 A 君贏 1,000 文港紙。

呢場博弈嘅報償矩陣,係好似表 1 噉嘅樣。當中 (x, y) 嘅結果表示 A 君贏 x 文而 B 君贏 y 文。假如 A 君跟從最大最大化嘅法則行事,佢會永遠選擇出藍咭:對佢嚟講,出紅咭嘅最大可得係 0,而出藍咭嘅最大可得係 1,000 文港紙,後者能夠令到「最高可以得到幾多報償」呢個數值最大化。問題係,如果 A 君跟從噉嘅法則行動,B 君就有著數—— B 君可以選擇永遠出紅咭,噉就會永遠都贏錢。一般認為,最大最大化冇考慮到對手會點樣反應,所以本質上就係唔理性嘅,只有天真嘅決策者(例如細路)先會採取噉嘅策略[1]

算法 編輯

應用 編輯

局制 編輯

參見 編輯

引咗 編輯

  1. (英文) 玩嘅策略史丹福大學,當中有講到 minimax 嘅概念。

外拎 編輯

損失規避 編輯

損失規避粵拼syun2 sat1 kwai1 bei6英文loss aversion)喺認知心理學上指人偏向鍾意避免損失多過得到同等嘅得益嘅傾向。

基本概念 編輯

睇埋:展望理論

損失規避係人類嘅一種經濟行為傾向,硬係覺得損失好似影響大啲噉,損失 X 文慘嘅程度大過得到 X 文嘅開心程度;損失規避令人有種傾向,想出盡全力避免損失。

喺一個展視損失規避嘅實驗當中,研究者可以去搵一柞受試者返嚟玩一啲買賣遊戲,途中問佢哋(例如)寧願賺多 10 文定係避免損失 10 文,結果多數係發現啲受試者通常都會揀後者-引證咗損失規避嘅假說[1]

非人研究 編輯

進化解釋 編輯

局限 編輯

應用 編輯

睇埋 編輯

引述 編輯

  1. Kahneman, D. & Tversky, A. (1992). "Advances in prospect theory: Cumulative representation of uncertainty". Journal of Risk and Uncertainty. 5 (4): 297-323.

文獻 編輯