官术网_书友最值得收藏!

第一章
盲點炸彈
不透明、規模化和毀滅性

1946年8月,一個炎熱的午后,克里夫蘭印第安人棒球隊主帥路·波德魯正經歷著他悲慘的一天。在雙重賽的第一場比賽中,泰德·威廉姆斯幾乎以一人之力橫掃了波德魯的整支球隊。威廉姆斯可能是當時最偉大的擊球手,在這場比賽中,他粉碎了三個全壘打,為自己的球隊贏得8分。最終,印第安人隊以10∶11遺憾輸球。

波德魯不得不采取反擊。所以,當威廉姆斯在雙重賽的第二場中第一次出現時,印第安人隊的球員就立即開始調整各自的場地位置。游擊手波德魯換到二壘手位置,二壘手退到右外場,三壘手換到波德魯的左邊,擔當游擊手。很明顯,波德魯在想方設法地改變球隊的防衛方向,力求截下威廉姆斯的擊球。

也就是說,他在像數據科學家一樣思考。他分析了原始數據——大多數都是靠觀察得到的:泰德·威廉姆斯通常會把球打到右外場。然后,他據此調整了球員的站位。結果,這個策略真的奏效了。外野手接住了威廉姆斯更多的極速平直球(但依然對飛過頭頂的全壘打束手無策)。

如果你今天再去看美國職業棒球聯盟的比賽,你就會看到,如今,球隊在制訂防守策略時會把幾乎每一個球員都看作威廉姆斯。波德魯僅僅是觀察了威廉姆斯通常的擊球位置,而現在的球隊經理則精確地知道每個球員以往擊每一個球時所在的位置,包括上周的、上月的、整個職業生涯的、面對左手投手時的等等。他們利用這一歷史數據分析對手的比賽策略,計算防守成功率最高的球員站位。有時候根據計算結果,全場球員都需要變換位置。

防守轉移只是一個更復雜的大問題中的一個小問題。這個大問題是:棒球隊可以采取哪些措施將自己獲勝的可能性最大化?棒球數據科學家在尋找答案時,仔細檢查了他們可以量化的每個變量,并賦予每個變量一個分值。二壘安打比一壘安打的價值高多少?什么時候值得用短打送跑壘者從一壘上二壘?

所有這些問題的答案混雜在一起,組合成了棒球運動數學模型。這些模型中的每一個都包含著各種各樣的可能性,包含棒球運動要素——從四壞球、全壘球到球員素質——中所有可測量的關系。模型的目標是尋找最優組合。如果揚基隊改為讓右手投手應對盎格魯隊的“神鱒”麥克·卓奧特,與使用原來的投手不變動相比,揚基隊有多大可能讓他出局?這又將如何影響其整場比賽的勝利概率?

棒球運動特別適合建立預測性數學模型。正如邁克爾·劉易斯在其暢銷書《點球成金》中所寫的,棒球運動一直以來都是數據癡迷者的熱門話題。過去幾十年,球迷們仔細研究棒球運動員卡片背面的數據,分析C. 雅澤姆斯基的全壘球模式,或者比較羅杰·克萊門斯和杜威·古登的出局總數。但是,從1980年開始,專業的統計學家開始分析這些數字以及大量新數據的真正意義:如何將這些數據轉化為勝利,球隊主理人如何用最少的錢使獲勝的可能性最大化。

“點球成金”現在指針對長期被認為僅受直覺控制的領域開發的統計方法。但是,棒球模型是有益模型,與我們生活中很多領域涌現出來的有害模型即數學殺傷性武器作用相反。棒球模型之所以公平,部分原因在于其模型是透明的。每個人都可以獲取作為模型根據的數據,并且或多或少能夠理解模型的結果應該怎么解讀。確實,一個隊的模型中也許本壘擊球手的表現權重更高,而另一隊的模型則可能沒那么看重本壘擊球手的作用,因為該隊的強擊手經常會打出三振出局。但無論如何,在這兩種情況下,全壘打和三振出局的實際次數都將展示在大家的眼皮底下。

棒球的統計也比較嚴謹。棒球專家手中掌握大量數據,而且幾乎所有的數據都和球員的表現直接相關??梢哉f,他們的數據和他們根據模型預測的結果高度相關。這聽起來也許平淡無奇,但讀完本書我們就會看到,建立數學殺傷性武器的人通常在他們最感興趣的行為方面缺乏相應的數據。所以,他們將本應通過調查獲得的數據替換成間接變量。他們在一個人的郵政編碼或語言模式和此人償還貸款的能力或者勝任工作的潛力之間建立聯系。這些聯系絕大部分具有歧視性,有些甚至是不合法的。而大多數棒球模型則不使用間接變量,它們只利用最直接的相關信息,如壞球、好球和安打的次數。

最重要的是,新的棒球數據還在不斷涌入,每年的4~10月,每天都有十二三場比賽的新數據涌入記錄系統。統計學家可以將這些比賽結果和他們開發的模型的預測結果進行比較,以找出模型哪里出了問題。比如,他們可能預測一個左手投手會多次把擊球機會讓給右手擊球手,但在實際的比賽中,左手投手自己擊了球。這樣的話,統計分析小組就得調整模型,研究哪里出錯了。投球手的新曲線球會影響他的數據嗎?投球手在傍晚進行的比賽中會有更好的投地表現嗎?統計學家可以把了解到的任何信息納入模型以完善模型。這就是可靠模型的運作方式??煽磕P偷拈_發者會對自己想要理解或者想要預測的所有事情進行反復的核實查證,并且模型必須隨著具體情況的改變而改變。

棒球模型中有成千上萬個不斷變化的量,你也許會好奇,我們為什么能把這種模型和華盛頓特區的教師評估模型進行比較。棒球運動模型追求細節,并且不斷更新;不透明的教師評估模型則似乎建立在少量的考試成績數據之上。后者真的是模型嗎?

教師評估模型確實是模型。模型只不過是某個過程的抽象表示,它可以表示棒球比賽結果、石油公司供應鏈、外國政府的行動或者電影院上座率。不管是電腦模型還是人腦里的模型,模型都會吸收我們知道的相關信息,并據此預測各種不同情況下的反應。我們每個人的大腦中都有成千上萬個模型,這些模型告訴我們什么是我們可以期待的,并指導我們做決定。

下面是我每天使用的信息模型。作為三個孩子的母親,家里的飯由我來做,我丈夫就不說了,他連要往煮意大利面的水里加鹽都記不住。每天晚上當我開始做飯時,我的大腦就不自覺地開始分析每個人的口味。我知道我的一個兒子喜歡吃雞肉(但是討厭吃漢堡),另一個兒子只愛吃意大利面(最好是加一些弄碎的帕爾瑪奶酪)。同時我還得考慮他們每天的口味變化,調整我頭腦中的模型。顯然,我的模型中有一些不可避免的不確定因素。

輸入到我內在家庭飲食模型的是這些信息:我的家人的偏好,我現在有的或者我知道可以買到的食材,還有我自己的精力、時間和決心。輸出的是我該如何做這頓飯以及具體做什么。我根據我的家人在吃完飯后的滿意程度、他們這頓飯的飯量以及食品的健康程度來評估一頓飯做得是否成功。根據飯的受歡迎程度和被吃掉的量,我會更新可以用于下次做飯的飲食模型。這些更新和調整讓我的飲食模型成為統計學家所說的“動態模型”。

我可以很驕傲地說,這么多年以來,我已經非常擅長給家人做飯了。但是,如果我和丈夫準備外出一周,而我想給我媽媽解釋我的模型,讓她代替我給孩子們做飯,那我該怎么辦呢?或者,如果我的那些初次為人父母的朋友想要知道我的做飯方法,那我又該怎么辦呢?這時候,我就應該將我的模型具體化、形式化和系統化,也就是說使其更加數學化。如果我有野心的話,我也許可以把它做成電腦程序。

一個理想的程序將包含所有可獲得的食品、食品的營養價值和成本,以及一個關于我家人口味的完整數據庫:每個人對食品的好惡。但是,我很難坐下來一一列出所有的信息。我有很多關于他們爭搶蘆筍、不要豆角的記憶,但我很難用一個可理解的公式把它們表述出來。

較好的解決辦法就是隨時間發展不斷地訓練模型。每天輸入買了什么、做了什么的相關數據,記錄家里每個人的反應。我也會錄入其他的參數或者約束條件。比如,我會限定只吃當季水果和蔬菜,盡量少做果醬餡餅,但不至于少到遭到家人公開反抗的程度。我還會給模型增加一些規則:這個喜歡吃肉,這個喜歡吃面包和意大利面,這個能喝很多牛奶,還總是吃什么都喜歡抹巧克力醬。

如果我把這件事當成首要工作來做的話,許多個月以后我也許就可以提出一個非常好的模型。我將把腦子里的食品管理系統、我的內部信息模型轉化成一個具象化的外在模型。在建立模型的過程中,我擴大了自己對世界的影響力。我構建了一個自動化的“凱西烹飪系統”,任何人都可以操作它,即使我不在場,它也能照常工作。

但是錯誤總會出現,因為模型的本質就是簡化。沒有模型能囊括現實世界的所有復雜因素或者人類交流上的所有細微差別。有些信息會不可避免地被遺漏。我也許會忘記在模型中加入一些規則,比如生日當天時垃圾食品的限制可以放松,或者比起用各種方法烹制出來的胡蘿卜,我的家人更愛吃生胡蘿卜。

因此,要建立一個模型,我們需要對各個因素的重要性進行評估,并根據我們選出的那些重要的因素將世界簡化成一個容易理解的玩具,據此推斷出重要的事實和行動。我們期待模型能較好地處理一種工作,同時也接受模型偶爾會像一個愚蠢的機器一樣存在很多信息盲點。

有時候,這些盲點不重要。當我們在谷歌地圖搜索如何去往目的地時,谷歌給出的世界模型就只有道路、隧道、橋梁,而忽略了建筑物,因為建筑物和我們想要的答案無關;當利用航空電子軟件指導飛機飛行時,該軟件給出的世界模型就只包含風、飛行速度和地面的著陸帶,而不會顯示街道、隧道、建筑物和人。

一個模型的信息盲點能夠反映建模者的判斷和優先級序列。谷歌地圖和航空電子軟件對于信息的選擇似乎已經是固定不變的了,但其他模型的信息選擇則存在著嚴重的問題?;氐街澳莻€例子,華盛頓特區學校的教師評估增值模型主要依據學生考試成績評價教師的教學質量,而忽視了教師對學生的投入度、在專業技能上的鉆研度、教學管理方面的成果以及在幫助學生解決私人和家庭問題上的表現等。該評估模型過于簡單,為追求效率犧牲了精確性和洞察力。但是,在學校領導層看來,該模型是把業績明顯不佳的幾百位老師找出來的有效工具,他們并不介意這意味著模型可能會誤解其中一部分人。

我們可以看出,盡管被普遍認為是不公正的,該模型還是能反映出建模者的目標和思想觀念。當我在模型中排除了每餐吃果醬餡餅的可能性時,我也是在把我的思想觀念強加到我的烹飪模型里。我們會毫不思索地做這件事。我們自己的價值觀和欲望會影響我們的選擇,包括我們選擇去搜集的數據和我們要問的問題。而模型正是用數學工具包裝出來的各種主觀觀點。

一個模型是否奏效也見仁見智。畢竟,不管是正式模型還是非正式模型,關鍵要素都是其對某事成功或符合標準的定義,這一點在我們探討數學殺傷性武器的典型特征時還會講到。我們不僅要問是誰設計的模型,還要問設計模型的人或者組織機構要達成什么目的。比如說,如果是由某個貧困國家的政府來為我的家庭飲食建立模型,則該模型的成功可能指在我們現有食物儲備的基礎上,以保證我們一家不至于陷入饑餓為前提,盡可能地降低成本。個人飲食偏愛將被很少考慮或者根本不予考慮。相反,如果是由我的孩子建立模型,則成功的特征可能就是每餐都可以吃冰激凌。而我自己的模型會綜合考慮資源管理和我孩子們的開心程度,還將參考我自己所確定的健康—方便—豐富—可持續性這一優先級序列。因此,我的飲食模型更為復雜。但是我的飲食模型確實反映了我的個人實際。另外,適用于今天的模型在明天的效果就不一定有那么好了。如果不經常進行更新的話,我的飲食模型就會被淘汰。食品價格會變動,家人的口味也會改變。在孩子們六歲時制定的飲食模型肯定不適用于他們進入青少年階段的飲食習慣。

內在模型也是如此。你可能會看到這樣的現象,祖父母隔了較長的一段時間再去探望孫子或孫女時往往就會出問題。上一趟來時,他們收集了孩子們知道什么、什么會讓他們笑、他們喜歡什么電視節目之類的數據,然后在無意識中建立了和五歲的孩子們有關的模型。而一年后再見到孩子們,會面的最初幾小時會讓他們感到困惑,因為他們的模型失效了。孩子們不再覺得湯姆斯小火車頭有意思了。他們需要花些時間重新收集有關孩子們的數據來調整自己的內在模型。

這并不是說,好的模型不可能簡單。一些非常有效的模型可能只有一個變量。最常見的家用或辦公室火災探測模型就只測量一個與火災密切相關的變量:煙的出現。通常來說,這就足夠了。但是當建模對象是我們的人類同胞時,只考慮簡單的變量就會出問題,或者說會使我們遭遇麻煩。

種族主義在個人層面上可以被視為在全世界數十億人的大腦中快速運轉的預言模型。這種模型是基于有缺陷的、不完整的或是籠統的數據建立的。無論是來自經驗還是來自傳聞,這些數據都是用來表明某一類人行為惡劣的。這種模型產生了一種二元論的預測,即某一種族的所有人都行為惡劣,非該種族的人則沒有這一特點。

不用說,種族主義者不會花大量時間搜集可靠數據修改他們扭曲的模型。他們的模型一旦變成一種信仰,就從此固定不變了。這種模型會生成有害假設,而且很少檢測這些假設的有效性,反而滿足于那些確認并鞏固這些假設的數據,同時忽視反面例證。因此,種族主義是最欠考慮的預測模型,它由隨機的數據采集和假性相關所驅動,被制度不公平加以強化,又被證實性偏見加以進一步劣化。這么說來,種族主義和我要在本書里探討的所有數學殺傷性武器十分相似。

1997年,非裔美國人杜安·巴克,一個已被定罪的殺人犯,在得克薩斯州哈里斯縣法庭接受審判。巴克已被證實殺了兩個人,陪審團必須要決定最后的裁決是死刑還是終身監禁、保留假釋機會。檢察官一方奮力爭取死刑判決,理由是巴克如果被釋放還會再殺人。

巴克的辯護律師帶來了一個專家證人,心理學家瓦特·基哈諾,不過對于巴克,他一點兒忙也沒幫上?;Z曾經研究過得克薩斯州監獄系統的累犯率,在法庭上,他提及巴克的種族與累犯率的相關性。在盤問證人時,檢察官抓住了這一點。

“你斷定,種族因素,黑色人種,會因為各種各樣的原因帶來社會上危險行為的增多。對嗎?”檢察官問道。

“是的,”基哈諾回答說。于是,檢察官在做案件總結陳述時強調了這一證詞。最終陪審團判定巴克死刑。

三年后,得克薩斯州檢察長約翰·康奈發現,上面那位心理學家在另外6個死刑案件中給出了同樣的種族論證詞,大多數案件發生于他在檢察機關工作期間。康奈——其后來于2002年當選美國參議院議員——下令為涉案的7名犯人重新召開不帶有種族偏見的聽證會。在媒體發布會上他聲明:“刑事司法體系中,將種族因素納入考慮范疇是不合理的……得克薩斯州人希望,也值得擁有人人平等的司法體系?!?/p>

這7名犯人中的6名重新接受了審判,但他們再次被判處死刑。法庭裁決,基哈諾的帶有偏見的證詞不是決定性因素。巴克沒有得到重新審判的機會,也許是因為提出種族論證詞的己方證人。他仍是死刑犯。

不管在審判時包含種族因素的證詞是否被明確提出,很長一段時間里,種族都是影響審判結果的一個主要因素。馬里蘭大學的一項研究表明,在哈里斯縣,包括休斯敦市,對于犯下同等罪行的犯人,檢察官判非裔美國人死刑的概率比白人高3倍,判拉美裔美國人死刑的概率比白人高4倍。這種情況并不是得州獨有的。美國公民權利聯盟的調查顯示,犯同樣的罪,黑人罪犯的刑期比白人罪犯的長20%。黑人只占據美國總人口的13%,但黑人罪犯占據了美國40%的牢房。

你可能會認為,利用電子化、數據化的再犯風險模型輔助判決能減少偏見對判刑的影響,更有利于實現公正判決。美國24個州的法院正寄希望于此,于是其采用了所謂的再犯模型作為輔助工具。再犯模型被用于幫助法官評估每一個罪犯的危險性。從很多方面來說,再犯模型的開發是一種進步,它使得審判更具一致性,更少被法官的情緒和偏見所影響。另外,再犯模型減少了罪犯的平均刑期,節省了政府開支。(關押一個犯人一年平均需花費31000美元,在康涅狄格和紐約州,該項成本還要翻一倍。)

但問題是,我們是徹底根除了人類偏見,還是只不過用技術包裝了人類偏見?再犯模型的開發是一個非常復雜的數學問題,而再犯模型的框架是由大量的假設構成的,其中一些假設本身就帶有偏見。而且,瓦特·基哈諾的公開證詞在被轉錄成文字之后,還可以供他人在法庭上閱讀和質疑,但一個再犯模型的運作完全是由算法獨立完成的,只有極少數專業人士能理解。

一個更普及的用于評估罪犯危險性的模型,叫作LSI–R(水平評估量表),其中包含一個需要罪犯填寫的冗長的問卷。其中一個問題,“你之前被定罪過幾次”與再犯風險高度相關。其他問題也非常相關,比如“其他人對你這次犯罪起了多大的作用?”“毒品和酒精對你這次犯罪起了多大作用?”

但是,當問題延伸到深挖罪犯的個人生活時,我們很容易想到,有特權背景的罪犯和來自治安差的城市貧民區的罪犯,他們的答案肯定不一樣。問一個在舒適郊區長大的罪犯“你第一次遭遇警察”的原因,他也許會告訴你這次入獄就是第一次。相反,生活在貧民區的年輕黑人男性很可能已經被警察攔截過許多次了,即使他們什么錯事也沒做。紐約公民權利聯盟2013年發表的一份研究報告顯示,14~24歲的黑人男性和拉丁美洲男性僅占該市總人口的4.7%,但其占被警察“攔截—盤查”總人數的40.6%。在這些被盤查的少數族裔中,超過90%的人都是無辜的,還有一些也許只是犯了未成年酗酒或者攜帶大麻的輕罪。不像大多數富人孩子,他們總會因為這些小事遭遇麻煩。所以,如果曾在早期“遭遇”過幾次警察就表示一個犯人是慣犯,這對窮人和少數族裔是很不公平的。

該問卷還沒有結束。罪犯還會被問及他們的朋友和親戚是否有過犯罪記錄。同樣,問在中產階級社區長大的罪犯這個問題,得到否定回答的可能性很高。調查問卷確實回避了種族問題,因為問種族問題是非法的,但是有了每個罪犯提供的大量生活背景細節,這個非法的問題也沒必要再問了。

自1995年LSI–R調查問卷投入使用以來,已經有成千上萬個罪犯做過這張問卷了。統計師利用所收集的答案設計出了一個模型,其中與再犯率高度相關的問題答案權重更高。罪犯在答完調查問卷之后,模型會基于他們的分數將其劃分為高、中、低三種風險等級。在美國的有些州,比如說羅得島州,這一測試僅用于找出那些正被監禁的罪犯中風險等級高的人,將其送入強化的勞改項目。但是在其他州,包括愛達荷州和科羅拉多州,法官會用模型給出的評分指導量刑。

這是不公平的。這份調查問卷涉及罪犯的出生地和成長環境,還包括他的家庭、所在街區和朋友,而這些細節不應該被視為和刑事案件或者量刑存在相關性。如果檢察官企圖通過提及被告兄弟的犯罪記錄或者其所在街區的高犯罪率去判定被告的話,正義的辯護律師就會大喊:“法官大人,我反對!”而嚴肅的法官會判定反對有效。這是我們法律系統建立的基礎。我們應該因為我們所做的事情而接受相應的審判,而不應該因為我們的身份而被審判。雖然我們不知道這些問題在問卷中所占的確切比重,但可以肯定地說,任何大于零的比重都是不合理的。

很多人會說,像LSI–R這樣的數據模型有助于評估罪犯的再犯風險,或者說至少比法官的隨意猜測要更精確一些。但是,即使我們暫且不談重要的公平問題,我們也已經陷入數學殺傷性武器創造的惡性循環之中了。得到“高風險”評分等級的人很可能本來就是失業人員,在其所生活的社區里,他的許多朋友和家人都觸犯過法律。得到這一評級是導致其刑期變長的一個原因,而多年和一群罪犯關在一起又增加了他再次犯罪的可能性。等他出獄之后,他又會回到同樣的貧窮社區,而這一次還有了犯罪記錄,對他而言,找工作變得更難了。如果他因生活所迫不得不再次犯罪,再犯模型就又一次得到了成功驗證。但事實上,正是這一模型本身導致了犯人陷入惡性循環,并且進一步鞏固了犯人的惡劣處境。這是數學殺傷性武器的典型特點。

這一章,我們已經研究了三種模型。棒球模型基本上是一種健康模型。這種模型信息透明,不斷更新,假設和結論大家都可以看到。棒球模型仰賴比賽進行過程中積累的真實數據,而不是替代性的間接變量。而且模型涉及的球員都明白比賽過程,且和模型的目標一致:贏得世界職業棒球大賽。(當然,這并不是說合同期內的球員不會對模型的評估結果發牢騷:“沒錯,我確實出局200次,但是請看看我的全壘打……”)

就我個人而言,我們討論的第二種模型,家庭飲食模型,絕對是一種良性模型。如果我的孩子們要質疑模型涉及的某個假設,不管是經濟上的還是飲食上的,我都會很樂意回答他們。即使有時候他們看到盤子里的綠色蔬菜會擺臭臉,但他們仍然會承認,大家在家庭飲食上的共同目標是方便、省錢、健康、美味,只不過在每個人自己的模型里,各要素的分量有所不同。(當他們開始自己做飯之后,他們就可以建立自己的模型了。)

我要補充說明的是,我的飲食模型絕對不可能規?;?。我并不樂于看到沃爾瑪、美國農業部或其他任何大型機構擁護我的模型,并強行將其施加到億萬人的生活中,就像應用那些我們在本書中要討論的數學殺傷性武器一樣。不,之所以說我的飲食模型是良性的,極其重要的一點是因為我的飲食模型永遠不會離開我的大腦,不會變成一串固定的代碼。

但是,本章最后的再犯模型則與前兩者完全不同。讓我們迅速做一個簡單的數學殺傷性武器判定練習,看看它是否屬于此類模型。

第一個問題:如果參與者知道自己是被模型評估的一個對象,或者知道模型的目的是什么,那么該模型還是不透明,甚至是隱形的嗎?絕大多數填寫強制調查問卷的罪犯都不是蠢蛋。他們多少都會懷疑自己提供的信息將被用來安排自己的監獄生活,比如會被關押更長的時間或更短的時間。他們知道游戲規則。但是監獄官也知道。因此,他們對LSI–R調查問卷的目的只字不提。否則的話,他們知道很多罪犯會弄虛作假,在離開監獄的那天做再犯風險調查問卷時回答得像個模范市民。所以,罪犯需要被盡可能地蒙在鼓里,不被告知自己的風險等級評分。

再犯模型遠非個例。不透明、隱形成了這類模型的規則,清晰、透明的模型倒成了例外。我們被模型分類為購物者、沙發懶蟲、病人和貸款申請者,而我們自己對此知之甚少,甚至仍在愉快地注冊各種把我們當成評估對象的應用程序。即使這些模型是良性模型,不透明還是給人一種不公平的感覺。如果你在進入一個露天音樂會現場之后,導引員跟你說你不能坐在前十排,你會覺得這很不合理。但是如果導引員跟你解釋前十排是為行動不便的人保留的,那你的感覺就大不一樣了。所以,透明很重要。

然而現實是,許多公司竭盡所能地隱藏它們的模型運算結果,甚至隱藏模型的存在。常見的一個辯護理由就是模型算法包含對它們的業務至關重要的“商業機密”。這是知識產權,如果有必要,公司必須在大批律師和說客的協助下為其維護算法機密性的行為進行辯護。比如谷歌、亞馬遜和臉書這樣的互聯網巨頭,它們為自己的業務量身定做的算法價值高達數十億美元。數學殺傷性武器是個深不可測的黑盒。因此,明確回答第二個問題特別困難:模型違反國民主體的利益嗎?簡單來說,模型是不是不公平的?它會破壞或毀滅一些人的生活嗎?

根據對于這個問題的回答,LSI–R再一次成為數學殺傷性武器的典型。毫無疑問,20世紀90年代建立該模型的人認為,LSI–R是提高刑事司法系統的公平和效率的一個有效工具。它能幫助沒有威脅性的罪犯縮短刑期,而這部分罪犯將因此獲得更多年的自由時間,同時這也將大大節省美國納稅人的錢,畢竟每年用于監獄運營與管理的財政開支高達700億美元。但是,再犯風險調查問卷是根據犯人的生活背景細節信息評判罪犯的危險等級的,而該細節信息在法庭上是不被允許作為證據出現的,因此這個模型是不公平的。雖然很多人可能會因此受益,但另一些人也因此受苦。

導致一部分人受苦的關鍵原因是模型造成的惡性循環。我們看到,再犯模型會根據一個人的成長環境來描述這個人的基本情況,它會自行創建一種使假設合理化的環境。而模型則在此惡性循環的過程中變得越來越不公平。

第三個問題:該模型是否有應用場景呈指數增長的潛力?用統計學家的話來說就是,該模型能否規?;??這聽起來可能像是一個書呆子數學家的較真,但是規?;拇_增強了數學殺傷性武器的破壞力,使其逐步轉變為我們生活中的決定性因素。我們將會看到,不斷發展的數學殺傷性武器在人力資源、健康、銀行等數不盡的行業快速確立普適準則,繼而對我們產生一種非常類似于法律的權威性影響。比如,如果你被銀行的模型認定為高風險貸款者,那么所有人都會把你當成賴賬不還的人,即使你完全不是這樣的人。當這個銀行的模型規模化后,就像現在的信貸模型那樣,你的一生都將生活在其陰影下,你能否買到公寓、找到工作或者買到車等,都將由這一模型來決定。

就規?;裕俜改P驮俅纬蔀橐粋€典型。大多數州已經投入使用這一評估模型,而LSI–R是其中最常見的一個,至少已在24個州中投入使用了。罪犯為數據科學家提供了一整個活躍的市場。刑罰體系積累了大量數據,因為罪犯比平常人享有更少的隱私權。而且,刑罰體系因為太過于臃腫、低效、高成本、缺乏人性而亟待改進。誰不想要這樣一個低成本的模型應用場景呢?

刑罰改革在今天這樣一個極化政治世界是一個極為罕見的議題,自由黨和保守黨在這一議題上有著共同的利益。2015年年初,保守黨的科氏兄弟,查爾斯和大衛,與自由黨的智庫“美國進步中心”合作推進監獄改革,致力于減少監獄人數。但是,我對兩黨合作加上其他一些團隊的共同努力,是否一定能夠提高用于監獄的評估模型的效率和公平依然持懷疑態度。即使其他的工具取代LSI–R成為監獄中的主要評估模型,監獄系統仍然是大規模數學殺傷性武器的強大孵化器。

綜上所述,數學殺傷性武器共有三個特征:不透明、規模化、毀滅性。這三個特征將在我們之后討論的案例中有不同程度的呈現。是的,確實存在有爭議的地方。比如,你可能會爭辯說再犯模型的評級分數不是完全不透明的,罪犯在一些情況下是可以看到自己的評級的。但是這個模型還是太神秘了,罪犯不知道根據他們給出的問卷答案,模型是如何推導出他們的分數的。評分算法是隱藏的。另外,少數數學殺傷性武器似乎不滿足規?;奶卣鳎驗樗鼈兊囊幠_€不夠大,或者至少現在還不會規模化。但它們是蓄勢待發的危險物種,可能會在將來的某一天突然開始以指數級的增長速度繁殖。所以我也把它們算在內了。最后,你可能還會指出,并不是所有的數學殺傷性武器都是有害的。畢竟,有些模型把一部分人送進了哈佛,讓一些人得到了低息貸款或者找到了工作,縮短了某些幸運重刑犯的刑期。但重點不是有沒有人受益,而是有很多人受害。這些數學殺傷性武器關閉了億萬人的機會之門,通常只是因為一些微不足道的理由,而且不予他們上訴的機會。因此,它們仍然是不公平的模型。

還有一個關于算法的事實是:算法能從一個領域跳躍性地應用于另一個領域,而且經常如此。傳染病學研究中的模型被用于預測票房,垃圾郵件過濾器的模型被用于發現艾滋病病毒。數學殺傷性武器也是如此。所以,如果監獄中的評估模型得到了成功應用(其實際功勞完全可以歸結為人類的有效管理),則它也將像其他的數學殺傷性武器一樣延伸到其他領域,給我們帶來附帶傷害。

以上就是我的觀點。威脅還在擴大。對此,金融領域已經為我們提供了一個警世寓言。

主站蜘蛛池模板: 深圳市| 临汾市| 清丰县| 垦利县| 西和县| 广平县| 洮南市| 泰州市| 准格尔旗| 广宁县| 云龙县| 甘泉县| 堆龙德庆县| 高雄县| 阆中市| 唐山市| 扶余县| 封开县| 银川市| 伊春市| 大田县| 交城县| 蕉岭县| 利川市| 噶尔县| 沐川县| 绥江县| 大荔县| 遂宁市| 得荣县| 黎平县| 罗山县| 托克托县| 鄄城县| 辽宁省| 遵义县| 馆陶县| 金湖县| 平凉市| 樟树市| 化州市|