傳言卡關延宕的Google新AI大型語言模型Gemini,外界本來預測會直接延至2024年第一季,沒想到意外地在本周(12/6)閃電登場。Gemini一系列意想不到的AI生成能力,這回可能換剛滿一歲的ChatGPT緊張了。因據測試看來,Google似乎略勝一籌。另外,在這領域的測驗,Gemini能力也超越人類。
AI人工智慧戰局進入新回合!網路巨頭Google搶快,本周推出殺手級應用「Gemini」,讓人驚喜的內容生成效益,可望讓Google一度搖晃的地位,稍稍穩定下來。
「這是我們目前為止最強大、最通用的模型,在很多領先的基準測試裡都展現最先進的性能,」Google 暨 Alphabet 執行長皮蔡( Sundar Pichai)表示。
Google Demind 執行長哈薩比斯( Demis Hassabis)則言,「我們發現 Gemini Ultra 在大型語言模型(LLM) 研究和開發中,廣泛採用的 32 個學術基準測試中,有 30 個取得了超越當前的最先進基準的效能」。
誰是「當前的最先進基準的效能」?說的就是競爭對手OpenAI最新版本GPT-4。《Business insider》引述Google高層說法,在MMLU 是測試裡,Gemini模型得分為 90.0%,擊敗了 OpenAI 的 GPT-4 的 86.4%。
從Gemini首波揭露的6分鐘影片來看,Gemini可以流暢的與人類進行語音對話,不僅能辨識人類正在手繪的簡圖,例如一隻藍色的鴨子,也能辨識真實物件,例如橘子、餅乾、毛線球。
有趣的是,Gemini不僅能描述圖形、圖片、影片,甚至可以提出符合情境的衍生問題,並且帶入英語以外的語言,辨識能力優異,例如中文發音的四聲音階,都可細緻分辨。Gemini展現的「個性」有如其名:雙子座,談吐幽默風趣,互動過程讓人經驗,真的是比真人更像真人。
Gemini在多領域的全知測驗裡「超越人類」
Gemini首度出現名號,是在今年五月Google I/O開發者大會,當時OpenAI 運營的ChatGPT來勢洶洶,Google首波迎戰的同類大型語言模型(LLM)「Bard」首場戰役居於下風,隨即推出第二波產品PaLM2應戰,並一口氣揭露下一波Gemini計畫。
皮蔡指出,現在數以百萬計的人,每天都在我們的各種產品裡使用生成式 AI,做到一年前做不到的事情,無論是替更複雜的問題尋找答案,或是用新的工具來協作和創造,「這樣的動能令人驚豔,但是我們探索這段旅程的各種可能性,其實才正要開始」。
今日(12/6)Gemini在美國發布,Google幾乎同時進行線上的全球媒體發布會,包括英國、日本、韓國、台灣、中國等國記者,第一時間見證Gemini的誕生。Gemini 1.0 版本的模型,計畫推出三種應用規模的產品,包括功能最強大、為高度複雜的任務而設計的Gemini Ultra;適合擴展、橫跨各種類型的任務的Gemini Pro:以及處理裝置上的任務最有效率的模型Gemini Nano。後兩項本月開放給外界申請使用,最高階的Gemini Ultra預計明年登場。
Gemini採用 MMLU (大規模多任務語言理解;massive multitask language understanding)當作基準測試的方法,讓 Gemini 利用推理能力,在回答難題前更仔細地思考,比起僅使用第一印象的評估方式有顯著進化。
Google DeepMind 產品副總裁柯林斯( Eli Collins)表示,在 MMLU測試裡,結合數學、物理、歷史、法律、醫學和倫理學等 57 個主題,測試模型對世界的理解還有解決問題的能力,「Gemini Ultra 以 90.04% 的高得分,成為第一個在 MMLU 測試裡超越人類專家的模型」。
Gemini關鍵競爭力是「多模態」,隱形助力則是它
整體觀察Gemini發展,關鍵競爭力在於「multimodal多模態」系統,它可以同步分析圖片、影像、聲音,並做出整合多樣態內容的解讀,並結合語言模型做出回應。相較於先前上市的眾多生成式AI,僅能執行單一類型,例如丟一張圖請AI判讀圖像時,不能同時判別聲音,Gemini可以同時執行的生成能力,是一大突破。
為了符合Google生成式AI大計,這場發布會同步宣告Google自研晶片TPU(Tensor Processing Unit),進入下一世代v5p,配置於雲端伺服器。每個 TPU v5p Pod在最高頻寬的晶片間互連 (ICI)上由 8960 個晶片組成,晶片速率為 4800 Gbps 。比上一代每秒浮點運算次數 (FLOPS)提高 2 倍以上,高頻寬記憶體 (HBM)提高 3 倍以上,是 Google 現今性能最佳、效率最高、擴充性最強的 TPU 系統,專為訓練頂尖 AI 模型所設計。
所以究竟為何Google可以彎道超車?自研符合自家運算架構的TPU,是重要關鍵,微軟與OpenAI少的就這一環,也難怪TPU進程是這場AI肉搏戰裡,需要秀的「肌肉」。