勞埃德·沙普利

2012 年諾貝爾經濟學獎 | 博弈理論之父:遊戲甚麼時候值得一玩?

正是勞埃德·沙普利的名言之一「美麗心靈 (A beautiful mind)」成為名著的的書名,其後更拍成同名電影,講述數學家小約翰·納什(John Forbes Nash Jr.)的故事,但這句名言也可以是他自己人生故事的標題。他不僅是博弈理論的共同創立人之一,他更跨越了自己的思維邊界,測試了時間的邊界,跨越了數學的障礙。沙普利為後來的經濟學家鋪好道路,協助他們預測數十億「參與者」的「遊戲」結果,他的貢獻令後世得以分析經濟和選舉制度中的權力動態。他的主要貢獻之一《婚姻問題》為後來的博弈理論學者奠定基礎,將穩定配對方式應用於學校、醫療甚至器官移植。沙普利通常被譽為博弈理論巨人,而他也確實對博弈遊戲情有獨鍾。

勞埃德·沙普利

勞埃德·沙普利

2012 年瑞典中央銀行紀念阿爾弗雷德·諾貝爾經濟學獎(共同獲得)

摘要

出生:1923 年出生於美國麻省劍橋市

離世:2016 年逝世於美國亞利桑那州圖森市

研究領域:博弈理論

獲獎研究:穩定配置理論與市場設計的實踐

其他遊戲:與納什 (John Nash)、豪斯納 (Mel Hausner) 和舒比克 (Martin Shubik) 發明了桌上遊戲《So Long Sucker》(1950年)

編碼技能:為了讓家人知道他在軍隊服役期間的去向,他給他們寫了一封提到查理叔叔的信,信裏每行第一個字母打直拼出:C-H-I-N-A

最愛的遊戲:《Kriegspiel》,一種類似國際象棋的桌上遊戲,遊玩時看不到對手的棋子

最愛的棒球隊:波士頓紅襪隊和洛杉磯道奇隊

博弈理論之父是一個難懂的人

沙普利喜歡的策略遊戲和智力測驗題仍然整齊地疊在一張小茶几上。沙普利在兒子彼得及妻子的照顧下,在亞利桑那州圖森市安享晚年。彼得告訴我們,這些謎題是重要的回憶,不僅是沙普利本人的回憶,也是彼得與父親一起渡過的童年回憶。彼得憶述:「扭計骰推出時,他會盯著它看很久,然後扭幾下,再盯著它,又再扭幾下,扭完就說『我用 20 下就解開了,還以為需要扭 200 下,但我可以完成的更快。』」作為數學家,他會尋找最佳解決方法,但不一定是最快的。他很擅長這點。」

1950 年,沙普利與包括納什在內的幾個朋友一起發明了一款名為《So Long Sucker》的策略遊戲,展示出他的數學能力和對謎題的熱情。

博弈理論對在軍隊中生存有幫助嗎?

在軍隊服役期間,他能夠找出自己的位置並向家人寄出加密訊息。由於他在哈佛就讀期間被徵召入伍,他的上級很精明,將他的專業知識用於支援,而非戰場。彼得告訴我們,他的父親過去常常「破解密碼並分析這類事情」。

彼得拿著沙普利軍服的照片

用演算法找出你的真愛

彼得向我們坦言,他對父親的博弈理論貢獻只有模糊的概念。可能是因為沙普利不是一個很好的老師,而他亦自知這點。彼得回憶道:「他說話的水平遠超出高中生甚至是大多數大學本科生的水平。」他對父親理論的了解是,穩定婚姻問題與婚姻無關。這只是對人或團體進行配對的比喻。但是,如果沙普利無法向非經濟學家解釋自己的理論,那誰能呢?

《婚姻問題》:博弈理論對找到真愛有用嗎?

我們在史丹福大學的辦公室與沙普利的共同得獎者(阿爾文·羅思 Alvin Roth)見面。他向《婚姻問題》致敬,因為那是他自己獲得諾貝爾經濟學獎的研究基礎。羅斯解釋說,沙普利的演算法讓他能夠找到穩定的配對,不是針對男性和女性,而是學童和學校,以及醫生和駐院實習計劃。羅斯說道,「男人」和「女人」是說明演算法運作的最簡單途徑,然後便開始為我們詳細說明一個例子。

我們怎樣才能得到好的配對結果?

他開始說:「假設每個男人都會向首選結婚對象的女人求婚,而每個收到多個求婚的女人都會拒絕除了她最喜歡那個對象之外的其他求婚者。根據這演算法,她沒有即時接受那個求婚,只是不拒絕他,她延遲決定。這演算法被稱為延遲接受演算法。」

根據沙普利與經濟學家大衛·蓋爾(David Gale)發明的演算法,如果沒有更多求婚,每個男人都會與他求婚而未被拒絕的女人結婚(如果有的話)。求婚被拒絕的男人會單身,同樣沒有被求婚的女人也會單身。羅思說:「蓋爾和沙普利證明的是,無論參加者的偏好是甚麼,延遲接受演算法都會產生穩定的配對結果。」

沙普利與蓋爾之間的信件界定定義演算法

有沒有可能預測博弈結果?

沙普利亦與他的數學家、和博弈理論家朋友羅伯特·奧曼 (Robert Aumann) 密切合作。彼得還記得他的父親和奧曼總會「為一個簡單的逗號爭吵幾個小時」。

奧曼說沙普利本應該比其他博弈理論家更早獲得諾貝爾經濟學獎,因為他的研究是其他博弈理論家立足的根基。他們兩位一起界定了奧曼—沙普利值(Aumann-Shapley value)。它建基於沙普利最著名的作品 —— 沙普利值,沙普利值是一種在遊戲開始前評估遊戲情況的方法。例如,它可以幫助你決定想玩遊戲還是去吃午飯。

沙普利喜歡專注理論,經常留待別人去將理論實踐於現實世界。彼得承認,他喜歡解決問題後就放手,然後尋找新的問題。

關於選舉,沙普利的研究教曉我們甚麼?

在所謂的沙普利-舒比克指數(Shapley-Shubik index)中,沙普利值成為了分析各種選舉情況的默認指南。彼得解釋道:「他提出了一個概念,並用數學證明了中等規模州份的選民在總統選舉中擁有更大權力。」

我們可以如何分析權力關係?

奧曼說:「五個國家有否決權:美國、英國、俄羅斯、中國和法國。」他指的是聯合國安全理事會。「還有 10 個國家沒有否決權。因此,你可以整理出權力關係。沙普利值的 98% 屬於那五大國家。有人會說否決權不是那麼重要。不,它非常重要。」

沙普利兒子彼得說,會見美國前總統奧巴馬是「他人生中最自豪的日子之一」。「自他在經濟大蕭條時期成長以來,父親一直都是民主黨人。」

根據沙普利舒比克指數,由一個大黨派和許多小黨派組成的議會民主制也可以看出權力分配情況。奧曼解釋:「大黨派可能擁有三分之一的選票,小黨派平分另外三分之二。這情況下,大黨派擁有三分之一的選票,但擁有一半的權力。團結就是力量。」

然後他反過來說,兩個大黨派各有三分之一的選票,許多小黨派分佔剩下的三分之一。「在那種情況下,團結缺乏力量。因為那樣的話,小黨派的力量更大。每個只有三分之一選票的大黨派擁有四分之一的權力,而一半的權力則分散在小黨派手中。」

遊戲大師:紀念勞埃德·沙普利

沙普利在經濟大蕭條時期成長,一生都是積極的民主黨人。彼得自豪地展示他、父親沙普利與他喜愛的美國前總統奧巴馬的合照。「我記得幾年前,我和他在高速公路上開車,他看到一個標誌,上面寫『這個項目由《美國復甦法》資助』。他說:『很好,這就是我成為民主黨人的原因。』因為那就是他們在 1932 年致力的事情。」

走過兩父子經常一起散步的圖森薩比諾峽谷時,彼得回憶起他父親生命的最後幾天。獲得諾貝爾經濟學獎是他父親一生的重要事件。彼得說:「但我認為他從來不希望獲得諾貝爾經濟學獎成為他人生最後一件重要的事件。」

為何各國必須找到更好的經濟增長方式?

聽聽米高·斯彭斯(Michael Spence)的想法,了解各國如何實現可持續發展,同時產生長期積極影響。

更多諾貝爾經濟學獎得主的故事