AI 幫你挑隊友?小心它學壞了——數據分析裡沒有人告訴你的偏見陷阱
AI 不會自己學壞,它只是把人的偏見執行得更有效率。
你以為這篇是要教你怎麼用 AI。
或者你以為要講的是某種很厲害的數據技術,是那種你得先學 Python 才能理解的東西。畢竟「機器學習」「演算法」「大數據」這幾個詞,聽起來就是屬於工程師的領地,跟一個在台灣做顧問、做行銷、做 PM 的你好像沒什麼關係。
可是,如果你曾經投過履歷石沉大海、或者你曾經用過任何系統來篩選人、或者你曾經相信「讓數據說話就好」,那這篇文章其實很直接地在講你。
其實這篇真正要講的是
AI 沒有偏見,但人有。而 AI 學的是人留下來的痕跡。
換言之,這篇要講的是:我們以為把決策交給演算法,就終於脫離了人類的主觀與偏見。但其實我們只是找了一個更有效率的工具,把幾十年來不敢承認的壞習慣,重新執行了一遍。
大多數人卡住的地方
卡住的地方通常有三個,我自己也卡過其中兩個(苦笑)。
第一個:「只要不放性別、種族,就不會有歧視。」
這個想法的問題在於,資料裡的變數之間是有關聯性的。你不放「性別」,但你放了「興趣愛好」,而某些興趣在統計上就是跟性別高度相關的。AI 不需要你明說,它會自己繞過去。就像你不想讓新朋友知道你很省錢,但你的 Threads 首頁全是「怎麼省電費」「自煮省一半」,人家大概也猜得到(哈哈)。
第二個:「準確度高就代表模型好。」
如果一個篩選模型的準確率是 95%,聽起來很厲害。但如果那 5% 的錯誤,全部集中在特定族群的候選人身上,這個「準確」,其實是對某些人的系統性傷害。數字不說謊,但數字選擇性地沉默。
第三個:「這是工程師的事,不是我的事。」
這是我覺得最危險的一個誤解。演算法偏見的根本,是一個關於「我們用什麼過去,來定義什麼未來」的價值判斷。這個判斷,不能完全外包給技術團隊。如果你在任何組織裡有任何決策角色,你就有責任參與這個對話。
第一個核心理解:AI 是歷史的影印機,不是未來的預言球
這是我覺得最根本、也最容易被忽略的一件事。
AI 演算法的運作方式,是從「過去的資料」裡找規律,然後用這些規律去預測「未來」。聽起來天衣無縫。但問題在於,「過去的資料」從來都不是中立的。它記錄的是,在某個特定環境、特定文化、特定時代下,某些人做了某些決定,然後某些結果發生了。
你把這些資料餵給 AI,它學到的就是:「在那個環境下,什麼樣的人,產生了什麼樣的結果。」它不知道這個資料本身是偏的。它不知道其他背景的人從來沒有被放進這個位置試試看。
舉個很直白的例子。如果過去二十年,一間公司的高階主管清一色是某一種背景的人,AI 就會學到「有這種背景的人適合當主管」。不是因為這是事實,而是因為資料就長這樣。
是故,AI 給你的預測,本質上是一個歷史的重播,而不是一個對未來的洞見。
這兩件事差很遠。
第二個核心理解:「準確」和「公平」是兩件不同的事,而且常常互相衝突
這個理解讓我花了一點時間才真的接受。
在統計上,一個模型的「準確度」是指它做對預測的比例。但公平性問的是另一個問題:這個模型,對所有人犯的錯,是不是差不多的?
想像一下:你設計了一個模型,預測哪些員工在試用期後會留下來。整體準確率 92%,聽起來很不錯。但仔細看,你發現它對某一類背景的員工,誤判率高達 40%。換言之,系統覺得這些人「高風險」,但實際上他們根本不是。
從「準確度」的角度,這個模型很好。從「公平性」的角度,這個模型在對某些人做系統性的不公平。
這兩個目標,有時候可以同時達到,但很多時候是一個天平:你在某個群體上提高公平性,可能就要犧牲一點整體的準確率。沒有人跟你說這個,是因為說出來很麻煩。它意味著你要選擇,而這個選擇,不能丟給工程師。
基此,每次看到一個「AI 輔助決策工具」,第一個要問的不是「準確率是多少」,而是「對哪些人最容易出錯」。
第三個核心理解:透明度不只是技術問題,它是一個信任問題
好,假設你現在是個主管,有人給你兩個工具:
一個是傳統的打分系統,根據年資、KPI 達成率、主管評分加權計算,邏輯清楚,每個步驟你都能解釋給員工聽。
另一個是一個黑箱 AI,準確率比前者高 8%,但沒人知道它為什麼給某個人打低分。
你選哪個?
很多人直覺選後者,因為準確率高。但在真實的組織裡,一個你無法解釋的決策,就是一個你無法替員工辯護的決策。當有人質疑你、甚至訴諸法律的時候,「AI 算出來的」不是一個答案。
這就是為什麼「可解釋性」現在愈來愈被認真討論。不是工程師想讓你讀懂程式碼,而是因為當有人來質疑你的決定,你總得能說出一個人話版本的理由吧。
就像數學考試,答對了但寫不出過程,你不確定他是不是真的懂,對吧?
複雜的模型不是不能用,但你得知道它在什麼情況下容易出錯,你得保留自己介入修正的能力。不能解釋的成功,往往藏著你自己都不知道的風險。
一個你現在就能做的練習
這個練習不需要任何技術背景,大概十分鐘,一個人就可以做。
我把它叫做「我的隱形標籤審查」。
Step 1:想一個你生活或工作中,最近有在用某種「規則」篩選人或事情的場景。可以是招募、可以是選合作夥伴,甚至可以是你在交友軟體上滑的習慣。
Step 2:列出三個你認為重要的「標準」。(比如:「回訊息要快」「有主動性」「履歷上有知名公司」)
Step 3:對每一個標準,問自己:這個標準,對哪些族群、哪些情境的人可能天生不公平?(「回訊息快」對需要照顧小孩的人,或是工作性質不適合頻繁使用手機的人,不公平。)
Step 4:如果把那些結構性不公平的因素剔除掉,這個標準還剩下什麼?那個「剩下的」,才是你真正想篩選的東西。
Step 5:問自己最後一個問題:如果把這個標準寫成程式碼,它會學到你想要的那個版本,還是你偷偷帶進去的那個版本?
很多人做完這個練習,會發現自己的標準比預期的更窄。這不是指責你,這是我們每個人都難逃的認知慣性。知道它在哪裡,才有辦法跟它拉開距離。
我的反思與你下一步可以怎麼學
我在 INSEAD 的第一學期,有一門課叫 Data Analytics for Decision Making。於我而言,進那門課之前其實有點自大,七年顧問、看過很多數字,心裡覺得應該不會太陌生。
然後我就被打臉了(哈哈)。
不是因為我不懂技術,而是因為我從來沒有認真思考過「這個分析在為誰服務」這個問題。我習慣問「這個模型對不對」,但我沒有問「這個模型對誰公平、對誰不公平、誰設計了這個規則、他們當時帶著什麼假設」。
這個轉變,比學任何工具都難。因為它需要你願意懷疑自己以為理所當然的東西。
捫心自問,我在台灣讀書、工作了這麼多年,說句不好聽的:我們從來沒有被鼓勵去問「這個規則是誰定的」,只被鼓勵去問「我要怎麼在這個規則裡贏」。但如果你想在未來的職涯裡,做一個真的有價值的決策者,你需要兩種能力:一種是讀懂數字,另一種是敢問數字背後的問題。
後者,才是比較難的那一個。
如果你想多走一步,不用去學寫程式。你只需要對任何一個你現在在用的工具,問一個問題:它學的資料是誰的、在哪個年代收集的?光是敢問這一句,你就已經在大多數同事前面了。
AI 學壞,不是 AI 的錯。是餵給它的過去太有把握。
我們能做的,是對自己的過去,少一點確定,多一點懷疑。共勉之~