進化博弈論

進化博弈論zeon3 faa3 bok3 jik6 leon6（英文：evolutionary game theory）係一套有關生物進化嘅理論，重點係將博弈論嗰啲「將個體之間嘅競爭想像成數學模型」嘅做法，攞嚟解釋生物進化相關嘅現象^[1]。

舉個簡單例子，想像家陣要分析老虎之間嘅競爭：同第啲動物一樣，老虎個體之間會爭嘢食同地盤等嘅有限資源；已知老虎有個體差異－有啲個體比較進取，吓吓都想盡力爭到令自己利益有咁大得咁大（鷹派），又有啲個體冇咁進取，比較傾向溫和同讓步（鴿派）；用進化博弈論做研究嘅動物學家會^[2]^[3]

將每種可能情境想像成一場博弈－「喺情況 A 下，揀做鷹會有 xx 咁多報償，揀做鴿會有 yy 咁多報償」、「喺情況 B 下...」... 如此類推；
然後計吓每種可能嘅策略－例如「永世做鷹」同「永世做鴿」噉－會攞到幾多總報償（個體為本模型）；
報償反映隻生物揀嘅策略有幾能夠幫佢生存落去同繁殖；

透過好似上述噉嘅分析，研究者就可以理解自然環境嘅特性（啲可能情境）會點影響老虎行為嘅進化（由「邊種策略最有利」反映）。到咗廿一世紀初，進化博弈論經已取得咗一定嘅成功，解釋到一啲古典進化論解釋唔到嘅行為現象，尤其係社會行為方面嘅現象。除此之外，進化博弈論原則上仲可以解釋到人類行為嘅進化，所以仲有俾社會科學嘅研究者採用^[4]^[5]。

基礎

兩隻貓喺度為咗爭地盤而準備郁手打交。

進化博弈論結合咗兩個重要嘅理論框架－進化論（theory of evolution）同博弈論（game theory）。

進化論同物競天擇：進化泛指一個族群嘅生物啲可遺傳特徵一代一代噉演變，而物競天擇就係進化其中一種最重要嘅機制；「通過物競天擇進化」嘅定義係指某啲基因^{[註 1]}因為有利生存同繁殖而變得更加常見，簡單例子有抗藥性－身上帶有「抗藥性勁嘅基因」嘅細菌個體冇咁易俾藥殺死，所以比較能夠生存同繁殖，所以喺下一代入面「抗藥性勁嘅基因」就變得更加常見，最後成個細菌種群整體慢慢噉變到愈嚟愈對隻藥有抵抗力^[6]。
博弈論：
- 原則上，個體之間嘅互動會對進化有一定嘅影響；淨係考慮同類個體之間嘅互動，同類會爭嘢食、地盤同交配機會等嘅有限資源，而喺人類當中，一個人應付其他人嘅能力會對佢生存同繁殖嘅能力有具體嘅影響，例如如果個人成日同人打交打到頭破血流嘅話，（假設第啲因素不變）生存嘅機率會低啲，自然將自己基因傳俾下一代嘅能力都低啲；
- 博弈論係應用數學上嘅一套分析方法，專門攞嚟分析決策者之間嘅互動；例如監犯困境嘅情況，而家差人拉咗阿明同阿松兩個嫌疑犯，但唔夠證據將佢哋兩個入罪，於是差人就分開兩個犯（等佢哋兩個之間冇辦法進行通訊），並且俾佢哋有以下嘅選擇^[7]－
  - 若果兩個犯其中一個認罪，並且作証檢控對方（背叛對方；betray），而且另外嗰個唔出聲（同對方合作；cooperate），噉認罪嗰個犯就會即時獲釋，唔出聲嗰個就要坐 10 年監。
  - 若果兩個犯乜都唔講（一齊合作），噉就兩個犯都坐半年監。
  - 若果兩個都互相檢舉（互相背叛），噉就兩個都齊齊坐 5 年。
- 如果用博弈論嘅報償矩陣（payoff matrix）表述上面嘅博弈，每個格嗰兩個數分別表示阿明同阿松嘅得失嘅話^{[註 2]}：

	阿明唔出聲（合作）	阿明認罪（背叛）
阿松唔出聲（合作）	$-0.5,-0.5$	$0,-10$
阿松認罪（背叛）	$-10,0$	$-5,-5$

進化博弈論所講嘅，就係用上面噉嘅博弈論分析，思考進化同物競天擇：進化博弈分析會將每個個體想像成一件會按自己策略做決策嘅物體－例如已知人同人之間有性格上嘅差異，有啲人比較容易信任同伴，所以比較傾向喺監犯困境嘅情境下揀合作，第啲動物都有噉嘅情況；跟住分析者就會計吓「如果每個個體都按自己策略行事，玩以上噉嘅博弈 $n$ 次之後，每個個體嘅總得失會係幾多？」噉嘅數（睇埋個體為本模型）；靠住噉嘅分析，研究者可以得知場博弈嘅特性會點樣影響「邊種策略最有效（最能夠令用佢嘅個體得益有咁大得咁大）」，一個個體得益大表示佢更加能夠生存同繁殖（進化適應性），並且將佢哋嘅行為傳去俾下一代－呢種分析就會解答到「點解人類進化到多數會噉樣噉樣做決策法」等嘅問題^[2]^[3]。例子喺下面。

進化博弈

鷹鴿博弈

直去定做懦夫
	阿松揀 C	阿松揀 S
阿明揀 C	0, 0	-5, +5
阿明揀 S	+5, -5	-100, -100

鷹鴿之爭
	對方係鴿	對方係鷹
A 揀做鴿	V/2	0
A 揀做鷹	V	V/2 - C/2

鷹鴿博弈（hawk-dove game）係進化博弈論最早郁手分析嘅博弈之一。鷹鴿博弈係種對稱博弈，想像而家有兩個人，佢哋揸住電單車向住對方迎頭衝刺，每個人都有兩個選擇揀（直去，S；做懦夫，C）^[8]^[9]：

如果佢哋兩個都直去唔轉軚嘅話，佢哋會相撞（報償：-100, -100）；
如果其中一方轉軚另一方直去，雙方都冇事，但轉軚嗰個人會俾人笑係冇膽鬼（-5）而直去嗰個人會俾人讚佢大膽（+5）；
如果兩個都轉軚，雙方都冇事（大家都 0）；

鷹鴿博弈可以模擬好多人類當中嘅博弈。人之間有性格上嘅差異，而且人之間成日都會爭嘢，當中有啲人進取啲，吓吓都想追求令自己利益有咁大得咁大，呢啲人就係所謂嘅鷹派（hawk），又有啲人冇咁進取，傾向溫和同順從，呢啲人就係所謂嘅鴿派（dove），而家想像一個簡化嘅世界，每個人都一係鷹派一係鴿派^[10]^[11]：

如果一個鷹派撞到一個鴿派，鴿派會順從，所以鷹派得到 $V$ 咁多利益，鴿派咩都冇（0）；
如果兩個都係鴿派，兩方平分利益，大家齊齊得到 $V/2$ 咁多利益；
如果兩個都係鷹派，佢哋就會打交，假設每個鷹派實力都一樣，都係有 50% 機率爭贏，兩方都各自平均攞到 $V/2$ 咁多利益，但因為打交打到兩個都損手爛腳，兩個都各喪失 $C/2$ 咁多利益；

噉嘅話問題係，「整體嚟講，做鷹派著數啲，定係做鴿派著數啲呢？」。呢條問題嘅答案取決於個群體嘅組成－鷹派最大嘅弱點係撞到第個鷹派就會損手爛腳，如果家陣成個群體有 $n$ 咁多個個體，得佢一個係鷹派，淨低嘅冚唪唥都係鴿派，噉佢就會好著數；相對嚟講，鴿派最大嘅優點係唔使成日打交，所以假設 $C$ 數值有返咁上下大，喺一個冚唪唥都係鷹派嘅世界裏面，做鴿派可以好著數。基於上述噉嘅思考，進化博弈研究者就做電腦模擬^{[註 3]}，虛擬碼大致如下^[12]：

初始化，設好嗮 $n$ 、 $V$ 同 $C$ 等嘅值（參數；呢啲值反映環境特性）；
創造 $n$ 個個體，每個個體掕住兩個數－兩個數分別表示佢嘅策略（係鷹定鴿）同總體報償；
隨機抽兩個個體出嚟，要佢哋按鷹鴿之爭嘅規則對局－
- 假設嗰兩個個體會按自己嘅策略行事；
- 計佢哋分別嘅總體報償點變，例如兩者嘅總體報償喺對局前係 0，而兩個都係鷹派，噉兩個對局後總體報償會由 0 變成 $(V/2-C/2)$ ；
「創造下一代」－喺呢代嘅對局當中，報償超過咗某個數嘅個體先有能力繁殖下一代，每隻下一代喺策略上會似自己父母（物競天擇）；
攞下一代嘅個體，重複步驟 3 同 4 若干次；

結果一如所料：當一個群體入面充滿咗鴿嗰陣，做鷹好著數，所以鷹嘅數量會一代一代噉升；當一個群體入面充滿咗鷹嗰陣，做鴿好著數，所以鴿嘅數量會一代一代噉升；因為噉，「淨係得鷹」同「淨係得鴿」嘅世界都係唔穩定嘅－兩個都會慢慢演變成「有鷹又有鴿」嘅世界，而「有鷹又有鴿」嘅世界就係一個穩定嘅世界（睇埋下面進化穩定策略）；呢樣發現對社會科學有所啟示－解釋得到「點解人類之間會喺攻擊性上有個體差異，有啲人係鷹派有啲人係鴿派」^[12]。

進階嘅分析仲會諗埋「睇吓 $V$ 同 $C$ 數值唔同會有乜影響」或者「想像啲個體唔係盲目噉一味做鷹或者一味做鴿，而係曉按某啲條件揀做鷹定鴿」等嘅問題。

鷹鴿之爭嘅電腦模擬結果；喺場模擬當中，

V=2

，

C=10

，黑線表示做鷹嘅報償，紅線表示做鴿嘅報償，打橫條軸表示鷹同鴿之間嘅比例；由幅圖度睇得出，喺一個充滿咗鴿嘅世界（左），做鷹相對著數，而喺一個充滿咗鷹嘅世界（右），做鴿相對著數。

消耗戰

監犯困境

進化單位

進化策略

穩定策略

不穩策略

社會行為

進化博弈論可以解到好多喺動物身上觀察到嘅社會行為。

利他行為

令到利他行為進化到出嚟嘅重複博弈
	B 君揀合作	B 君揀背叛
A 君揀合作	2, 2	-1, 3
A 君揀背叛	3, -1	0, 0

古典進化論入面其中一個大問題係解釋利他主義（altruism）嘅進化：利他行為係指一啲對自己冇明顯利益、而係有利他人嘅行為，例如假想有個人參與一場懦夫博弈，唔係揀對自己最有利嘅策略，而係無條件噉揀俾佢對手羸；由古典進化論嘅角度嚟講，呢種行為驟眼睇好似唔合理，因為噉做唔能夠直接噉令到個個體提升自己嘅進化適應性，正路嚟講理應唔會零舍通過到物競天擇嘅考驗流傳到落嚟。廿世紀中至後期嘅生物學家用進化博弈論嚟思考人類當中嘅利他行為，佢哋假想一個簡單嘅博弈模型，規則如下：喺呢場博弈當中有兩個博弈者，兩者各有兩個選項－合作（cooperate）同背叛（defect），如果雙方合作，報償會係（2, 2），而如果其中一方合作另一方背叛，合作方損失 1 而背叛方得益 3，最後如果雙方都選擇背叛，報償會係（0, 0）。呢個模型能夠模擬好多人類現實面對嘅問題－人類日常做嘅工作有好多都要求佢哋合作先做得成^[13]^[14]^[15]。

跟住呢班科學家又假想一個人類群體入面有三種人：

無條件嘅合作者（係唔係都揀合作嘅）；
無條件嘅背叛者（係唔係都揀背叛嘅）；
有條件嘅合作者－呢種合作者一般會揀合作，除非佢認得個對手，而個對手之前揀過背叛。

然後班科學家用進化論嘅思路嚟諗嘢：行為係可以遺傳嘅^[16]，所以佢哋用一個簡單嘅模型，假想仔女所屬嘅類型同父母一樣，而一個個體「成功噉生到後代嘅機會率」同佢「最後手上嘅資源量」成正比；佢哋用呢個模型模擬，結果發現，無條件嘅合作者好容易俾無條件嘅背叛者利用，話咁快就因為損失太多資源、生唔到後代而走向滅絕；而跟住落嚟失敗嘅係無條件嘅背叛者－有條件嘅合作者喺撞到無條件嘅背叛者嗰陣識得唔好合作，但撞到其他有條件嘅合作者嗰時識得要合作令自身利益最大化，結果打低咗無條件嘅背叛者，成為咗個群體入面嘅大多數。雖然以上呢個模型做咗好多簡化嘅假設，但佢的確能夠相當準噉描述到現實：事實係，心理學等領域嘅研究表明咗，人類多數都係傾向做有條件嘅合作者－佢哋會做利他嘅行為，但前題係佢哋嘅利他對象唔會利用佢哋嘅好意。呢個進化博弈論分析幫助解釋點解利他行為喺人類裏面進化到出嚟，對進化論嘅發展作出咗貢獻^[15]^[17]。

真社會性

訊號理論

共同進化

進階模型

註釋

↑ 嚴格啲講係等位基因。
↑ 以「幾多年嘅自由」嚟量度，例如「 $-0.5,-0.5$ 」表示兩個都喪失半年嘅自由。
↑ 佢哋行嘅係個體為本模型。

睇埋

文獻

Davis, Morton,; "Game Theory – A Nontechnical Introduction", Dover Books, ISBN 0-486-29672-5
Dawkins, Richard; "The Selfish Gene", Oxford University Press, ISBN 0-19-929114-4
Dugatkin and Reeve; "Game Theory and Animal Behavior", Oxford University Press, ISBN 0-19-513790-6
Hofbauer and Sigmund; "Evolutionary Games and Population Dynamics", Cambridge University Press, ISBN 0-521-62570-X
Kohn, Marek; "A Reason for Everything", Faber and Faber, ISBN 0-571-22393-1
Sandholm, William H.; "Population Games and Evolutionary Dynamics", The MIT Press, ISBN 0262195879
Segerstrale, Ullica; "Nature's Oracle - The life and work of W.D. Hamilton", Oxford University Press, 2013, ISBN 978-0-19-860727-4
Sigmund, Karl; "Games of Life", Penguin Books, also Oxford University Press, 1993, ISBN 0198547838
Vincent and Brown; "Evolutionary Game Theory, Natural Selection and Darwinian Dynamics", Cambridge University Press, ISBN 0-521-84170-4

攷

↑ Maynard-Smith, J.; Price, G. R. (1973). "The Logic of Animal Conflict". Nature. 246 (5427): 15-18.
↑ ^2.0 ^2.1 Altenberg, Lee (1995). "Genome growth and the evolution of the genotype-phenotype map". In Banzhaf, Wolfgang; Eeckman, Frank H. (eds.). Evolution and Biocomputation: Computational Models of Evolution. Lecture Notes in Computer Science. 899. Berlin; New York: Springer-Verlag Berlin Heidelberg. pp. 205-259.
↑ ^3.0 ^3.1 Birdsell, John A.; Wills, Christopher (2003). "The Evolutionary Origin and Maintenance of Sexual Recombination: A Review of Contemporary Models". In MacIntyre, Ross J.; Clegg, Michael T. (eds.). Evolutionary Biology. 33. New York: Springer Science + Business Media.
↑ Game Theory, Evolutionary Stable Strategies and the Evolution of Biological Interactions.
↑ Newton, Jonathan (2018). "Evolutionary Game Theory: A Renaissance 互聯網檔案館嘅歸檔，歸檔日期2021年8月17號，." (PDF). Games. 9 (2): 31.
↑ Lewontin, R. C. (November 1970). "The Units of Selection". Annual Review of Ecology and Systematics. Palo Alto, CA: Annual Reviews. 1: 1-18.
↑ Poundstone, William (1993). Prisoner's Dilemma (1st Anchor Books ed.). New York: Anchor. pp. 8, 117.
↑ Rapoport, A., & Chammah, A. M. (1966). The game of chicken. American Behavioral Scientist, 10(3), 10-28.
↑ Cheng, S. F., Reeves, D. M., Vorobeychik, Y., & Wellman, M. P. (2004). Notes on equilibria in symmetric games.
↑ Grafen, A. (1979). The hawk-dove game played between relatives. Animal behaviour, 27, 905-907.
↑ Neugebauer, T., Poulsen, A., & Schram, A. (2008). Fairness and reciprocity in the hawk–dove game. Journal of Economic Behavior & Organization, 66(2), 243-250.
↑ ^12.0 ^12.1 Gilbert, N., & Troitzsch, K. (2005). Simulation for the social scientist. McGraw-Hill Education (UK).
↑ Hamilton, W. D. (1963). The evolution of altruistic behavior. The American Naturalist, 97(896), 354-356.
↑ Bowles, S. (2006). Group competition, reproductive leveling, and the evolution of human altruism. Science, 314(5805), 1569-1572.
↑ ^15.0 ^15.1 The Evolution of Trust.
↑ Grove, W. M., Eckert, E. D., Heston, L., Bouchard Jr, T. J., Segal, N., & Lykken, D. T. (1990). Heritability of substance abuse and antisocial behavior: a study of monozygotic twins reared apart. Biological psychiatry, 27(12), 1293-1304.
↑ Trivers, R. L. (1971). The evolution of reciprocal altruism. The Quarterly review of biology, 46(1), 35-57.

拎

[6] 嚴格啲講係等位基因。

[9] 以「幾多年嘅自由」嚟量度，例如「 $-0.5,-0.5$ 」表示兩個都喪失半年嘅自由。

[14] 佢哋行嘅係個體為本模型。

[1] Maynard-Smith, J.; Price, G. R. (1973). "The Logic of Animal Conflict". Nature. 246 (5427): 15-18.

[altenberg1995-2] 2.0 ^2.1 Altenberg, Lee (1995). "Genome growth and the evolution of the genotype-phenotype map". In Banzhaf, Wolfgang; Eeckman, Frank H. (eds.). Evolution and Biocomputation: Computational Models of Evolution. Lecture Notes in Computer Science. 899. Berlin; New York: Springer-Verlag Berlin Heidelberg. pp. 205-259.

[birdsell2003-3] 3.0 ^3.1 Birdsell, John A.; Wills, Christopher (2003). "The Evolutionary Origin and Maintenance of Sexual Recombination: A Review of Contemporary Models". In MacIntyre, Ross J.; Clegg, Michael T. (eds.). Evolutionary Biology. 33. New York: Springer Science + Business Media.

[4] Game Theory, Evolutionary Stable Strategies and the Evolution of Biological Interactions.

[5] Newton, Jonathan (2018). "Evolutionary Game Theory: A Renaissance 互聯網檔案館嘅歸檔，歸檔日期2021年8月17號，." (PDF). Games. 9 (2): 31.

[lew-7] Lewontin, R. C. (November 1970). "The Units of Selection". Annual Review of Ecology and Systematics. Palo Alto, CA: Annual Reviews. 1: 1-18.

[poundstone1993-8] Poundstone, William (1993). Prisoner's Dilemma (1st Anchor Books ed.). New York: Anchor. pp. 8, 117.

[rapoport1966-10] Rapoport, A., & Chammah, A. M. (1966). The game of chicken. American Behavioral Scientist, 10(3), 10-28.

[11] Cheng, S. F., Reeves, D. M., Vorobeychik, Y., & Wellman, M. P. (2004). Notes on equilibria in symmetric games.

[12] Grafen, A. (1979). The hawk-dove game played between relatives. Animal behaviour, 27, 905-907.

[13] Neugebauer, T., Poulsen, A., & Schram, A. (2008). Fairness and reciprocity in the hawk–dove game. Journal of Economic Behavior & Organization, 66(2), 243-250.

[Gilbert2005-15] 12.0 ^12.1 Gilbert, N., & Troitzsch, K. (2005). Simulation for the social scientist. McGraw-Hill Education (UK).

[16] Hamilton, W. D. (1963). The evolution of altruistic behavior. The American Naturalist, 97(896), 354-356.

[17] Bowles, S. (2006). Group competition, reproductive leveling, and the evolution of human altruism. Science, 314(5805), 1569-1572.

[evooftrust-18] 15.0 ^15.1 The Evolution of Trust.

[19] Grove, W. M., Eckert, E. D., Heston, L., Bouchard Jr, T. J., Segal, N., & Lykken, D. T. (1990). Heritability of substance abuse and antisocial behavior: a study of monozygotic twins reared apart. Biological psychiatry, 27(12), 1293-1304.

[20] Trivers, R. L. (1971). The evolution of reciprocal altruism. The Quarterly review of biology, 46(1), 35-57.

[1]

[2]

[3]

[4]

[5]

[註 1]

[6]

[7]

[註 2]

[8]

[9]

[10]

[11]

[註 3]

[12]

[13]

[14]

[15]

[16]

[17]