2009年1月6日 星期二

囚犯的兩難-賽局理論與數學天才馮紐曼的故事

經濟學系的學生大都要唸「賽局理論 」相關主題,某些商學EMBA也會提到賽局理論的研究跟應用。本書在台北市立圖書館相當熱門,一個月內不看完,很少有機會再續借一個月。

這本書是在講匈牙利猶太人天才數學家 John Von Neumann 個人的生平傳記簡介跟這個理論如何因為他而受人舉世注目。就跟許多天才一樣,他的個性與思考模式總是超乎常人理解的範圍,書中有許多他令人驚奇的生活故事、愛情故事,其他像是會說 7 種語言、超強記憶力、五年就唸完大學跟博士班,以及後來進入高等學府、研究機構的一些活動軼事,包括在冷戰期間,為 RAND Corporation 蘭德研究機構 (p. 115,一家由美國空軍支持的智庫單位 )做戰略研究像是他鼓吹預防性戰爭 。書中還提到許多跟他同時代的聰明腦袋,一些諾貝爾獎得主之類的同儕,愛因斯坦也是同時代人物,兩人雖曾共事但並不如傳說中的熟識。





RAND 機構

John Von Neumann在許多領域都有卓越的貢獻,一般而言認定他對賽局理論(Game theory)跟電腦發展的貢獻最大。 賽局理論裡「囚犯的困境」發生在生物學、心理學、社會學、經濟學、法律的領域。只要有利益衝突的地方,就有囚犯的困境。對於動物、人類社會為什麼呈現目前的社會組織型態,囚犯的困境的研究提出很強的解釋能力。




John Von Neumann, 1903-1957




另外一名對 Game theory 有卓越貢獻的是 John Forbes Nash。Von Neumann對賽局遊戲的二人零和賽局,也就是一個人的收益正是另一人損失的遊戲,得出大中取小的定理。Nash的主要研究是「非零和賽局、以及有三個以上三參與者的賽局」。Nash的一生也被搬上螢幕,變成電影,就是美麗人生(A beautiful Mind),就跟電影演的一樣,真實的 Nash 在後產生了一些精神方面的問題。不過賽局理論的發明並非由Von Neumann獨享,法國數學家 Esmile Borel 早他七年,在1921年發表了賽局理論的論文也考慮了欺騙的問題,但他並沒有繼續對此主題發表深入的論文。


John Nash at a symposium of game theory at the University of Cologne, Germany (2006)

John Forbes Nash, 1928

如果沒有Von Neumann對電腦的貢獻,可能就沒有賽局理論的第三位卓越貢獻者 Robert Axelord 利用電腦程式跑實驗程式的計算結果。他的程式實驗結果顯示「一報還一報」的策略是最佳的獲益策略。Von Neumann 身兼IBM公司顧問,協助該公司確定電腦技術的發展方向,以數位而非類比的機器儲存二進位(而非十進位)數字的軟體程式。Von Neumann和他的同事沒有積極申請專利,顯然是為了鼓勵電腦技術的應用和推廣。



Robert Axelord 現在還活著,他的網站:http://www-personal.umich.edu/~axe/


賽局理論的故事與相關用語

囚犯的困境
  • 囚犯困境是普遍的概念,理論家已經體認到它會出現在生物學、心理學、社會學、經濟學、法律等領域。只要有利益衝突的地方就會有囚犯困境,而利益衝突並非只發生在有感知能力的生物之間。

小孩分蛋糕的故事 (p. 60)--大中取小(p. 73)
  • 馮紐曼從數學證明了雙人賽局,只要彼此利益完全對立,就永遠存在一個理性的行動方針,這一證明稱為「大中取小定理」(Minimax theorem),典型的例子如第二點。
  • 不管父母多小心翼翼,兩個小孩總覺得自己的蛋糕比較小,甚至兩個都這樣覺得。解決這個問題的著名方法是一個切分蛋糕,一個選。這樣,貪婪的動機保證了蛋糕有公平的分配,切蛋糕的不能質疑蛋糕不一樣大,第二個也不能抱怨,因為是自己挑的。對切蛋糕的人來講,他必須切得很平均,不然他就只能在一樣大的半塊跟比它小之間做選擇,此稱「大中取小」。遊戲者偏離此最佳策略只會對自己不利。
  • 卡爾維諾在《如果在冬夜,一個旅人》寫道:「你知道,你能期盼最好的結果是避免最壞的情況。」這個警句充分說明了大中取小策略。

賽局樹(p. 63)
  • 賽局理論的嚴格假設是對象必須完全理性的遊戲者,不會在跳棋遊戲中誤跳,在下棋時落入陷阱。因此一個招式都有對應的招式,因此每種招式演化的結果就像是一棵樹的策略步驟。

賽局表(p. 67)
  • 賽局理論,策略是最要得概念,比一般意義下的策略有更精確的含意。它是指更特定計畫…策略必須周密的預先描述所有的行動,以致你永不需要在某一行動之後再做什麼決定。
  • 例如圈叉OX遊戲,劃x在中央,O就有兩種完整的反應方式,若劃在角落,有哪幾種策略。
  • 這個遊戲可以用表格做對應,形成賽局表,x走啥,O就走啥。
零和賽局(p. 71)
  • Winner takes all.的賽局情況,例如玩家把錢投入罐子,贏家可以取走罐子裡全部的錢。
  • 這種賽局與經濟學內容有明顯的相似之處,例如「零和社會」,意思是有人得就有人失,也就是「天下沒有白吃的午餐」。
大中取小定理(p. 85)
  • 大中取小定理證明,每個有限的零和賽局都存在一個理性解,不是單純策略,就是混和策略。
  • 當兩個利益完全相反地人有定義精確的衝突,其中總存在一種理性解。所謂理性的解就是在既定的衝突本質下,雙方都確信他們不可能有更好的結果了。
n人賽局:
  • 有任意數量的參賽者,這種賽局稱為「n人賽局」,錯綜複雜的利益糾葛衝突,會產生聯盟關係,改變賽局發展方向。

竊賊的信用(P. 138)
  • 兩難困境中最重要的第三個是「不合作的一對」,例子:
  • 假定你偷了知名的「世界之鑽」,想脫手賣掉。你認識潛在買主叫做「大條先生」黑社會大亨,世界最冷酷、殘忍的人,非常聰明,極端狡詐貪婪。你們達成協議,一手交錢一手交貨,大條先生建議在郊外荒蕪的麥田見面交易,這樣就不會有目擊者。你偶然得知,他過去的秘密交易都是在交易時,出槍打死對方,帶著錢貨離去。
  • 知道他的策略,於是你提出雙麥田計畫,大條先生把錢放在州北邊的一塊麥田,你在藏在南邊的麥田。雙方透過電話聯繫,交換如何找到這些藏起來的錢和鑽石。你很圓滑的說服大條先生接受計畫,因為你身上沒鑽石,他是精明的商人,不是殺人狂,沒理由躲在北邊麥田伏擊你。他同意此計畫。
  • 在南邊藏鑽石時,你突然念頭一閃:為何不留著鑽石自己用呢?大條先生到南邊麥田之前,他不可能知道你背信,你會等他電話並把藏寶地點告訴他,假裝啥事也沒發生。那時,你已經到達北邊麥田,拿了錢逃跑了,再也見不到大條先生。
  • 突然腦筋又一閃:大條先生肯定也懷著同樣的鬼胎,他和你一樣聰明,也許還貪婪十倍,他樂於背信,你也絕對鬥不過他。
  • 在這個例子裡,遵守協議,欺騙只會破壞彼此的利益。
  • 就算一般的合法交易也潛藏囚犯困境,付錢買了一批貨物,怎知銷售商會不會拿了預付款就溜走了,他又怎知你會不會止付那張支票。



大條先生遵守
背信
你遵守
順利完成交易
你輸掉鑽石,他拿走鑽石,省下錢
你背信
你拿走錢,賺到鑽石,大條先生損失錢
雙方白忙一場,鑽石仍在你手上,他也沒損失錢

均衡解(p. 141)
  • 所謂均衡解是以馬後炮的方式回顧遊戲,就是以事後知道的結果去推論分析。

塔克的兩難故事(P. 153)
  • 1950年,哈佛大學心理系請塔克演講,為了讓缺乏賽局理論背景知識的心理學的聽眾瞭解賽局理論,塔克設計了「囚犯的兩難」故事,成為廣為人知的理論。
  • 兩個共同犯法的人被警察羈押,雙方都被告知:
    1. 如果一人招,另一人不招,前者可拿到獎金,後者被處以罰金
    2. 如果二人同時招,兩人都處以罰金
    3. 如果二人都不招,兩人都將無罪開釋
  • 衍生版本的故事,犯罪幫派的兩個成員被逮住並羈押,且隔離偵訊,警察承認沒有足夠的證據指控二人罪行,他們打算以較輕的罪名判處二人各一年監禁。同時也許諾,先做出不利同夥證供,將獲得釋放,而他的同伴將被判刑三年監禁。這裡的陷阱是,如果二人都做不利對方證詞,二人都被判刑2年監禁。
  • 這個例子是至少要關一年,除非供出對方不利證詞,對方也如此想,對自己最有利的方式就是供出不利對方的證詞,這樣才有機會不坐牢,如果我供出了,對方沒做,我不用坐牢。最可能產生的情況就是兩人都要坐牢2年。


B拒絕與警方交易B供出不利A的證詞
A拒絕與警方交易
A1年, B1年
A3年, B0年
A供出不利B的證詞
A0, B3年
A2年, B2年

  • 但這種協商式的偵訊有可能造成問題。例如1990.01.29《洛杉磯時報》就如此寫過兒童謀殺犯哈里斯的死刑判決案:
    1. 搶劫殺人犯案件常有一人以上的犯罪份子,應判決死刑的也不只一人。根據加州大學柏克萊分校法學教授和死刑專家齊默林的說法,對檢方而言:「重要的是觸地得分,達成死刑判決」。
    2. 因此這類案件常出現這樣的競爭:犯人爭先指出同犯,與檢方達成交易,以做出不利同夥的證明換取自己的減刑。
    3. 齊默林說,某些情況,已經永遠分不清楚誰是真正的殺人兇手,是接受寬大處理的人,或接受了死刑裁決的人?
搭霸王車(白搭便車)的故事(p. 165):
  • 個人利益與群體利益的衝突。搭火車逃票,個人得利,長久下來火車可能虧本無法經營。因此逃票的行為,被視為不道德。
  • 滿足恐怖份子、綁架者的要求,會不會鼓勵更多這樣的行為?但這樣的行為卻不會被視為不道德,雖然真正不道德的是綁匪、恐怖份子(OS:因為這些人是邪派)。
  • 「白搭便車的背叛」最常被拿來反對摩爾的烏托邦和馬克思主義的理由。

核武競賽(p. 169)
俄亥俄研究(p. 225)
膽小鬼遊戲(p. 255)--古巴飛彈危機
志願者的兩難困境(p. 261)
圍捕公鹿(p. 284)
不對稱賽局(p. 288):握有不同資源,差異性導致必輸或必贏的局面。

最適者生存
1980年代生物學、社會學成了賽局理論最活躍的應用領域。許多生物之間各種形式的合作和競爭在過去無法解釋,現在賽局理論提供了富有說服力的答案。(p. 301)

穩定策略(p. 302)
合作與文明(p. 326)
美元拍賣(p. 333):陷入無可避免的升級競賽,不升級就損失,唯一解決方式就是一開始就退出比賽。人類行為具備自我回饋的放大效果,幾輪放大後,導致全面衝突。

一報還一報:

賽局理論失靈的地方(p. 351):無法逆向分析,必須一開始就知道喊價的極限,喊價的極限不確定就很難做到。所以在拍賣、地緣政治,賽局理論都派不上用場。
最大數賽局(p. 354)

賽局類型的wikipedia解釋


台版週遭生活的例子:

阿扁當市長採取嚴厲的交通管理措施
633 競選支票跳票
金錢外交
對抗外交
和談策略
最適合獨立的時機已過


--馮紐曼小時候,他父親在拍賣上標到一座圖書館的書,在家中特地開闢一處存放這些書。馮紐曼從小就在這樣有利的環境持續閱讀,造就他日後的成就。


p.56

-- 賽局理論其實並非一般人理解的「玩」的科學,它是關於理性但互不信任的人之間的衝突…他(馮紐曼)常談到欺騙、報復以及無邊際的不信任,這才是賽局理論的部份內容。賽局理論是研究有完善邏輯思維能力,只在乎贏的玩家,力爭最好的結果,這才是賽局理論分析的對象。

-- 賽局理論是憤世嫉俗者的創意。某些評論家認為馮紐曼本身的諷世特質影響了這個理論。…賽局理論是嚴密的數學研究,從觀察衝突的理性方式中演變而來。…賽局理論中的某些數學與馮紐曼用來處理量子物理的數學是密切相關的。

-- 賽局理論與機率論(在很多遊戲上都應用到此理論)最大的差異是必須考慮別的玩家怎麼想。玩撲克牌的人知道被人猜中自己手上的牌就是大事不妙(因此,運用「撲克牌臉」表情,就不會露底。)撲克牌好手不會只看機率玩牌,還得考慮其他對手的行動得出結論,有時還要試圖欺騙其他對手。

-- 賽局理論最早發表的人是法國數學家 Esmile Borel 在1921年就開始陸續發表賽局理論的的論文,與馮紐曼的研究幾乎一樣用撲克牌的例子,也考慮了欺騙的問題。Borel 很重視賽局理論在軍事與經濟方面的潛在應用價值…並警告不要過份簡化理論而應用於戰爭問題。1925年當上法國海軍部長,他就沒有繼續發表更深入的論文。他的論文的確啟發了馮紐曼的研究,這是沒有太大疑問。

P. 47
-- 有超強記憶力,相機般的清晰記憶,有這種能力嶀常沒有太好結果。俄羅斯心理學家露麗亞最出名的病人「S.」對過去的記憶太清晰了,無法區分眼前的到底是事實或回憶,導致人生最後幾年在精神病院度過。

p.104
--電腦是馮紐曼在1940年代所發明的機器的某個衍生版。他身兼IMB公司顧問,協助他們確定了電腦技術發展方向,以數位(而非類比)的機器儲存二進位(而非十進位)數字的軟體程式(而非用硬體連接器)。他跟同事沒積極申請專利,顯然是為了鼓勵電腦技術的應用和推廣。

沒有留言: