做出決策的關鍵因素是預測和判斷,而這正是人類不擅長的事情。隨著AI技術進展,預測的成本也就降低,我們將有機會更頻繁地運用。這是一場預測技術的通用革命,將顛覆傳統決策流程與商業模式,連擁有權力的機制都會轉移。(本文節錄自《AI顛覆經濟學》一書,作者:阿杰・艾格拉瓦,約書亞‧格恩斯,阿維・高德法布,啟動文化出版,以下為摘文。)
提到 AI 時,一般人想到的是流行文化中到處可見的智能機器。
他們想到了像 R2-D2(編按:電影《星際大戰》系列中一個機器人角色)或瓦力(WALL-E,編按:皮克斯製作的動畫科幻電影),這樣有用的機器人;想到像《星際迷航記》(Star Trek)中的百科(Data)或《鋼鐵人》(Iron Man)中的賈維斯(J.A.R.V.I.S.),這樣卓越的隊友。
他們還會聯想到反派角色,比如《2001 太空漫遊》(2001)中的哈兒(HAL 9000)或《復仇者聯盟》(The Avengers)中的奧創(Ultron)。
無論他們有什麼怪癖或意圖,這些對 AI 的描繪都具有一個共同點:沒有人質疑它們,能夠像我們一樣思考、推理和具有行動力。
我們可能開發出能夠做到上述一切的技術,但目前並非如此。
我們現在擁有的是一種統計技術的進步,而不是能夠思考的東西。但這種統計技術的進步非常顯著。
在這種進步發揮潛力後,就能大幅降低預測的成本,而預測正是我們在各處進行的活動。
近年來,AI 領域的一個重大事件是,展示了所謂「深度學習」的卓越機器學習新技術。2012 年,由傑弗瑞.辛頓領導的多倫多大學團隊使用深度學習技術,顯著提高了機器識別圖像內容的能力。
團隊使用了名為 ImageNet 的資料集,其中包含數百萬幅影像,在十幾年的期間,一直試圖設計能準確識別圖像內容的運算法。該資料庫中具有人類預先分類的內容。
他們打算利用這個資料庫開發演算法,然後將新圖像輸入該演算法。接著,這些演算法將與能夠識別圖像內容的人類進行比賽。人類在這項任務上表現得並不完美,但在 2012 年之前,他們遠遠優於任何演算法,但在 2012 年後,這種情況開始有所改變。
深度學習方法將識別圖像內容的任務視為預測問題,目標是能夠在給予新圖像時,預測出人類可能認定的圖像內容。在面對小狗圖像時,任務不是理解圖像中的小狗如何形成,而是猜測圖像中的東西最可能屬於現有標籤中的哪一個。
因此,目標就是猜測最有可能的正確標籤,這就成了預測。在納入大量屬性(attributes)及其組合(在運算上做到這點相當不容易)後,多倫多團隊展示了深度學習能夠在猜測方面超越其他演算法,最終甚至超越大多數人類。
這種描述可能讓人覺得機器做的是「即興發揮」,而不是在解決問題。但這可說是強化版的即興。機器的預測之所以有用,是因為它比其他任何方法更準確,成為我們決策時的關鍵輸入。(延伸閱讀│諾獎化學得主預言:AI設計藥物若可行,20年內多數疾病可治癒)
相關性與因果關係
數據提供了使預測成為可能的資訊。隨著 AI 獲取更高品質的數據後,預測的結果也日趨準確。所謂的品質,意味著你擁有預測目標的背景脈絡資料。統計學家稱之為需要在有數據的「支持」下,進行預測。根據你擁有的資料過度推論,預測可能不準確。
在資料的支持下進行預測,並不是從更多不同的環境中收集資料,以確保不會過度推論或避免過度預測未來,實際上沒有那麼簡單。有時你需要的資料並不存在。這就是世界各地統計學課程中一再重複的金句:相關性不一定等於因果關係。
在美國玩具業,廣告和收入之間有很強的相關性。廣告支出在 11 月底急劇增加,持續約一個月。在這段大量廣告的時間裡,玩具銷售額驚人。光看資料,可能會讓人忍不住想在全年增加廣告。當然,如果業界在早春時,像在聖誕節前一個月那樣進行廣告,那麼四月份的收入可能會增加。
然而,該行業並未這麼做。四月的玩具廣告量遠低於 12月。這意味著沒有足夠的數據能夠用來預測,在四月份增加廣告對玩具銷售情況有何影響。
從廣告和收入之間的逐月相關性看來,你無法判斷是廣告帶來收入,還是聖誕節同時帶來兩者。這種相關性可能是因果關係,因此增加四月份廣告支出可能導致玩具銷售顯著增加。
當然,也有可能廣告並不是造成12 月銷量的主要因素。而是因為聖誕節來臨,同時帶來廣告和銷量。此外,廣告確實可能增加 12 月的銷量,但由於四月份購買玩具的美國人遠少於其他時間,因此每年這個時候的廣告不會對銷售量造成影響。
換句話說,單憑預測機器無法獲得足夠的訊息:了解到如果改變業界的廣告策略,將對四月份的玩具銷售產生什麼影響。要發現這種關係,你需要使用不同的統計方法─「因果推論」(causal inference)。
就像 AI 一樣,這個方法在過去幾年也出現重大突破(2021 年諾貝爾經濟學獎,就是為因果關係分析的進步而頒發),愈來愈清楚的是,這些工具本身是對AI 的補充,在許多情境中,為 AI 提供了實現有效預測所需的資料。
世界頂級的 AI 公司都體認到這一點。例如,2021 年三位諾貝爾獎得主中,有兩位替亞馬遜工作。除了原本的學術職位外,吉多.因本斯(Guido Imbens)是核心 AI(Core AI)團隊的科學家,而戴維.卡德(David Card)則是亞馬遜學者(Amazon Scholar)。
因果推論的挑戰拘限了 AI 的運用,僅可用於收集相關資料。AI 在玩遊戲方面非常有效,包括西洋棋、圍棋和《超級瑪利歐兄弟》。每次的遊戲情境都是相同的,因此不需從過往資料中進行太多推論到當前遊戲。
此外,由於遊戲是軟體,對於不在資料中的情況,可以進行模擬實驗。這些實驗使得 AI能夠填補其餘資料,探索如果按下不同按鈕或嘗試新策略會怎樣。
這就是 DeepMind(編按:AI 公司,2014 年被 Google 收購)的 AlphaGo 和 AlphaGo Zero,用以找出以往在高階競賽中未曾使用的策略。DeepMind 進行了數百萬次的模擬實驗,藉由模擬嘗試多種不同的方法預測獲勝策略。
在許多商業情境下,皆有可用資料。如果沒有,通常可以透過實驗收集。商業實驗通常比遊戲需要更長時間,因為它是以人類的速度進行,而非以電腦運行模擬的速度。儘管如此,這仍是一種強大的工具,可以收集相關資料,成為對 AI 有用的輸入。(延伸閱讀│給財會人員的AI指南:別再用Excel!這樣塑造數據洞察與分析力)