系統與組織

AI 幫你挑隊友？小心它學壞了——數據分析裡沒有人告訴你的偏見陷阱

AI 不會自己學壞，它只是把人的偏見執行得更有效率。

你以為這篇是要教你怎麼用 AI。

或者你以為要講的是某種很厲害的數據技術，是那種你得先學 Python 才能理解的東西。畢竟「機器學習」「演算法」「大數據」這幾個詞，聽起來就是屬於工程師的領地，跟一個在台灣做顧問、做行銷、做 PM 的你好像沒什麼關係。

可是，如果你曾經投過履歷石沉大海、或者你曾經用過任何系統來篩選人、或者你曾經相信「讓數據說話就好」，那這篇文章其實很直接地在講你。

其實這篇真正要講的是

AI 沒有偏見，但人有。而 AI 學的是人留下來的痕跡。

換言之，這篇要講的是：我們以為把決策交給演算法，就終於脫離了人類的主觀與偏見。但其實我們只是找了一個更有效率的工具，把幾十年來不敢承認的壞習慣，重新執行了一遍。

大多數人卡住的地方

卡住的地方通常有三個，我自己也卡過其中兩個（苦笑）。

第一個：「只要不放性別、種族，就不會有歧視。」

這個想法的問題在於，資料裡的變數之間是有關聯性的。你不放「性別」，但你放了「興趣愛好」，而某些興趣在統計上就是跟性別高度相關的。AI 不需要你明說，它會自己繞過去。就像你不想讓新朋友知道你很省錢，但你的 Threads 首頁全是「怎麼省電費」「自煮省一半」，人家大概也猜得到（哈哈）。

第二個：「準確度高就代表模型好。」

如果一個篩選模型的準確率是 95%，聽起來很厲害。但如果那 5% 的錯誤，全部集中在特定族群的候選人身上，這個「準確」，其實是對某些人的系統性傷害。數字不說謊，但數字選擇性地沉默。

第三個：「這是工程師的事，不是我的事。」

這是我覺得最危險的一個誤解。演算法偏見的根本，是一個關於「我們用什麼過去，來定義什麼未來」的價值判斷。這個判斷，不能完全外包給技術團隊。如果你在任何組織裡有任何決策角色，你就有責任參與這個對話。

第一個核心理解：AI 是歷史的影印機，不是未來的預言球

這是我覺得最根本、也最容易被忽略的一件事。

AI 演算法的運作方式，是從「過去的資料」裡找規律，然後用這些規律去預測「未來」。聽起來天衣無縫。但問題在於，「過去的資料」從來都不是中立的。它記錄的是，在某個特定環境、特定文化、特定時代下，某些人做了某些決定，然後某些結果發生了。

你把這些資料餵給 AI，它學到的就是：「在那個環境下，什麼樣的人，產生了什麼樣的結果。」它不知道這個資料本身是偏的。它不知道其他背景的人從來沒有被放進這個位置試試看。

舉個很直白的例子。如果過去二十年，一間公司的高階主管清一色是某一種背景的人，AI 就會學到「有這種背景的人適合當主管」。不是因為這是事實，而是因為資料就長這樣。

是故，AI 給你的預測，本質上是一個歷史的重播，而不是一個對未來的洞見。

這兩件事差很遠。

第二個核心理解：「準確」和「公平」是兩件不同的事，而且常常互相衝突

這個理解讓我花了一點時間才真的接受。

在統計上，一個模型的「準確度」是指它做對預測的比例。但公平性問的是另一個問題：這個模型，對所有人犯的錯，是不是差不多的？

想像一下：你設計了一個模型，預測哪些員工在試用期後會留下來。整體準確率 92%，聽起來很不錯。但仔細看，你發現它對某一類背景的員工，誤判率高達 40%。換言之，系統覺得這些人「高風險」，但實際上他們根本不是。

從「準確度」的角度，這個模型很好。從「公平性」的角度，這個模型在對某些人做系統性的不公平。

這兩個目標，有時候可以同時達到，但很多時候是一個天平：你在某個群體上提高公平性，可能就要犧牲一點整體的準確率。沒有人跟你說這個，是因為說出來很麻煩。它意味著你要選擇，而這個選擇，不能丟給工程師。

基此，每次看到一個「AI 輔助決策工具」，第一個要問的不是「準確率是多少」，而是「對哪些人最容易出錯」。

第三個核心理解：透明度不只是技術問題，它是一個信任問題

好，假設你現在是個主管，有人給你兩個工具：

一個是傳統的打分系統，根據年資、KPI 達成率、主管評分加權計算，邏輯清楚，每個步驟你都能解釋給員工聽。

另一個是一個黑箱 AI，準確率比前者高 8%，但沒人知道它為什麼給某個人打低分。

你選哪個？

很多人直覺選後者，因為準確率高。但在真實的組織裡，一個你無法解釋的決策，就是一個你無法替員工辯護的決策。當有人質疑你、甚至訴諸法律的時候，「AI 算出來的」不是一個答案。

這就是為什麼「可解釋性」現在愈來愈被認真討論。不是工程師想讓你讀懂程式碼，而是因為當有人來質疑你的決定，你總得能說出一個人話版本的理由吧。

就像數學考試，答對了但寫不出過程，你不確定他是不是真的懂，對吧？

複雜的模型不是不能用，但你得知道它在什麼情況下容易出錯，你得保留自己介入修正的能力。不能解釋的成功，往往藏著你自己都不知道的風險。

一個你現在就能做的練習

這個練習不需要任何技術背景，大概十分鐘，一個人就可以做。

我把它叫做「我的隱形標籤審查」。

Step 1：想一個你生活或工作中，最近有在用某種「規則」篩選人或事情的場景。可以是招募、可以是選合作夥伴，甚至可以是你在交友軟體上滑的習慣。

Step 2：列出三個你認為重要的「標準」。（比如：「回訊息要快」「有主動性」「履歷上有知名公司」）

Step 3：對每一個標準，問自己：這個標準，對哪些族群、哪些情境的人可能天生不公平？（「回訊息快」對需要照顧小孩的人，或是工作性質不適合頻繁使用手機的人，不公平。）

Step 4：如果把那些結構性不公平的因素剔除掉，這個標準還剩下什麼？那個「剩下的」，才是你真正想篩選的東西。

Step 5：問自己最後一個問題：如果把這個標準寫成程式碼，它會學到你想要的那個版本，還是你偷偷帶進去的那個版本？

很多人做完這個練習，會發現自己的標準比預期的更窄。這不是指責你，這是我們每個人都難逃的認知慣性。知道它在哪裡，才有辦法跟它拉開距離。

我的反思與你下一步可以怎麼學

我在 INSEAD 的第一學期，有一門課叫 Data Analytics for Decision Making。於我而言，進那門課之前其實有點自大，七年顧問、看過很多數字，心裡覺得應該不會太陌生。

然後我就被打臉了（哈哈）。

不是因為我不懂技術，而是因為我從來沒有認真思考過「這個分析在為誰服務」這個問題。我習慣問「這個模型對不對」，但我沒有問「這個模型對誰公平、對誰不公平、誰設計了這個規則、他們當時帶著什麼假設」。

這個轉變，比學任何工具都難。因為它需要你願意懷疑自己以為理所當然的東西。

捫心自問，我在台灣讀書、工作了這麼多年，說句不好聽的：我們從來沒有被鼓勵去問「這個規則是誰定的」，只被鼓勵去問「我要怎麼在這個規則裡贏」。但如果你想在未來的職涯裡，做一個真的有價值的決策者，你需要兩種能力：一種是讀懂數字，另一種是敢問數字背後的問題。

後者，才是比較難的那一個。

如果你想多走一步，不用去學寫程式。你只需要對任何一個你現在在用的工具，問一個問題：它學的資料是誰的、在哪個年代收集的？光是敢問這一句，你就已經在大多數同事前面了。

AI 學壞，不是 AI 的錯。是餵給它的過去太有把握。

我們能做的，是對自己的過去，少一點確定，多一點懷疑。共勉之～

AI 幫你挑隊友？小心它學壞了——數據分析裡沒有人告訴你的偏見陷阱

其實這篇真正要講的是

大多數人卡住的地方

第一個核心理解：AI 是歷史的影印機，不是未來的預言球

第二個核心理解：「準確」和「公平」是兩件不同的事，而且常常互相衝突

第三個核心理解：透明度不只是技術問題，它是一個信任問題

一個你現在就能做的練習

我的反思與你下一步可以怎麼學

Read more

寫給兩年前的自己：一個台灣永續顧問，怎麼走進 INSEAD MBA

為什麼你越努力，反而越不賺錢？拆解固定成本謬誤

別再執著 100%：縮小分母，才是真正的財富邏輯

垃圾變黃金：為什麼你用不到的東西，可能正是別人的寶物