AI 能力

AI 能力很強 但它讀不懂言外之意

人工智能

廣告

哈佛商學院與 BCG 曾合作過一項大規模實驗:讓 700 多名諮詢顧問使用 GPT-4 完成一系列接近真實工作的諮詢任務。結果耐人尋味。在落在人工智能(AI)能力邊界內的任務上,使用 AI 的顧問完成得更快,質量也更高;但在一個被設計為超出 AI 能力邊界的複雜管理問題上,使用 AI 的顧問反而更容易得出錯誤結論。

一種解釋是模型能力仍有邊界。但另一個常被忽視的原因或許更值得重視:複雜任務往往依賴大量沒有被說出口的標準——甚麼算「好」,怎樣算「達到要求」,哪些邊界不能越過。這些標準存在於人的經驗裏,卻很少被寫成規則。
這並不是一個新問題。它恰好對應知識理論和組織管理中一個經典概念:默會知識(tacit knowledge)。
這一概念最早由科學哲學家 Michael Polanyi 系統提出,核心洞察是:「我們知道的,遠比我們能說出來的多。」默會知識指的是那些難以用規則、流程或語言完整概括,卻真實存在於經驗和判斷中的知識。

一個資深編輯對「好標題」的直覺、一個投資人對「時機」的把握、一個設計師對「差一點」和「剛剛好」之間的分辨。這些判斷每天都在發揮作用,卻幾乎無法完整寫進操作手冊。
理解了這一點,就不難解釋人們使用 AI 時最常見的困惑:問題往往不是「AI做不了」,而是「AI做出來的不是想要的」。原因在於,AI並不知道使用者心中那些沒有被表達出來的標準。
這種說不清楚的默會知識,使得將工作交給AI變成一件不簡單的事。而這又引出管理學和組織經濟學中另一個經典議題:委派(delegation)。
經濟學家Aghion和Tirole在研究中指出,委派的核心張力在於:委託方在移交部分控制權的同時,仍然希望代理方的行動與自身目標保持一致。委派可以提升代理方的信息獲取和主動性,但代價是委託方會失去一部分控制權。

管理人時,委派之難往往來自下屬有自身偏好和私人收益,可能選擇對自己更有利、但不一定對委託方最優的行動。

AI委派核心挑戰

管理 AI 時,難點有所不同:AI 不會因為私人利益而偷懶或選擇性執行,但它也不會自動獲知那些沒有被說出口的標準。換句話說,AI 委派的核心挑戰,不是傳統意義上的激勵不一致,而是任務是否被充分說明、背景是否被充分提供、結果是否能被有效驗證。
技術社區為解決此問題探索了不少工程方法,從提示詞工程(prompt engineering)到駕馭工程(harness engineering)。
但回到底層結構來看,它們做的事情有很大一部分是相通的:把原本只存在於人腦中的判斷標準,儘可能外化為 AI 可讀取、可執行、可校驗的形式。這個過程,本質上是在降低默會知識傳遞和結果驗證的成本。

這意味著,使用 AI 的過程不能默認「它應該知道」,也不能指望它自動領會慣例。那些存在於個人經驗和團隊默契中的判斷標準,需要被轉化為可傳遞、可複用的明確表達。
也就是說,在AI時代,每個人都应逐漸變成定義標準的人。在把任務交給AI之前,有幾個問題值得提前想清楚:AI 的角色是甚麼?它應該從哪幾個角度考慮這個問題?這個任務的成功標準是甚麼?有沒有AI可以學習的案例?有哪些是必須避免的錯誤?
這幾個問題看似簡單,但能回答好,本身就是一種稀缺的管理能力。

作者:童欣、傅禹銘(香港大學經管學院)

撰文:港大經管學院