Google新模型Gemini：得分勝ChatGPT！更像真人

傳言卡關延宕的Google新AI大型語言模型Gemini，外界本來預測會直接延至2024年第一季，沒想到意外地在本周（12/6）閃電登場。Gemini一系列意想不到的AI生成能力，這回可能換剛滿一歲的ChatGPT緊張了。因據測試看來，Google似乎略勝一籌。另外，在這領域的測驗，Gemini能力也超越人類。

AI人工智慧戰局進入新回合！網路巨頭Google搶快，本周推出殺手級應用「Gemini」，讓人驚喜的內容生成效益，可望讓Google一度搖晃的地位，稍稍穩定下來。

「這是我們目前為止最強大、最通用的模型，在很多領先的基準測試裡都展現最先進的性能，」Google 暨 Alphabet 執行長皮蔡（ Sundar Pichai）表示。

Google Demind 執行長哈薩比斯（ Demis Hassabis）則言，「我們發現 Gemini Ultra 在大型語言模型（LLM）研究和開發中，廣泛採用的 32 個學術基準測試中，有 30 個取得了超越當前的最先進基準的效能」。

誰是「當前的最先進基準的效能」？說的就是競爭對手OpenAI最新版本GPT-4。《Business insider》引述Google高層說法，在MMLU 是測試裡，Gemini模型得分為 90.0%，擊敗了 OpenAI 的 GPT-4 的 86.4%。

從Gemini首波揭露的6分鐘影片來看，Gemini可以流暢的與人類進行語音對話，不僅能辨識人類正在手繪的簡圖，例如一隻藍色的鴨子，也能辨識真實物件，例如橘子、餅乾、毛線球。

有趣的是，Gemini不僅能描述圖形、圖片、影片，甚至可以提出符合情境的衍生問題，並且帶入英語以外的語言，辨識能力優異，例如中文發音的四聲音階，都可細緻分辨。Gemini展現的「個性」有如其名：雙子座，談吐幽默風趣，互動過程讓人經驗，真的是比真人更像真人。

Gemini在多領域的全知測驗裡「超越人類」

Gemini首度出現名號，是在今年五月Google I／O開發者大會，當時OpenAI 運營的ChatGPT來勢洶洶，Google首波迎戰的同類大型語言模型（LLM）「Bard」首場戰役居於下風，隨即推出第二波產品PaLM2應戰，並一口氣揭露下一波Gemini計畫。

皮蔡指出，現在數以百萬計的人，每天都在我們的各種產品裡使用生成式 AI，做到一年前做不到的事情，無論是替更複雜的問題尋找答案，或是用新的工具來協作和創造，「這樣的動能令人驚豔，但是我們探索這段旅程的各種可能性，其實才正要開始」。

今日（12/6）Gemini在美國發布，Google幾乎同時進行線上的全球媒體發布會，包括英國、日本、韓國、台灣、中國等國記者，第一時間見證Gemini的誕生。Gemini 1.0 版本的模型，計畫推出三種應用規模的產品，包括功能最強大、為高度複雜的任務而設計的Gemini Ultra；適合擴展、橫跨各種類型的任務的Gemini Pro：以及處理裝置上的任務最有效率的模型Gemini Nano。後兩項本月開放給外界申請使用，最高階的Gemini Ultra預計明年登場。

Gemini採用 MMLU （大規模多任務語言理解；massive multitask language understanding）當作基準測試的方法，讓 Gemini 利用推理能力，在回答難題前更仔細地思考，比起僅使用第一印象的評估方式有顯著進化。

Google DeepMind 產品副總裁柯林斯（ Eli Collins）表示，在 MMLU測試裡，結合數學、物理、歷史、法律、醫學和倫理學等 57 個主題，測試模型對世界的理解還有解決問題的能力，「Gemini Ultra 以 90.04% 的高得分，成為第一個在 MMLU 測試裡超越人類專家的模型」。

Gemini關鍵競爭力是「多模態」，隱形助力則是它

整體觀察Gemini發展，關鍵競爭力在於「multimodal多模態」系統，它可以同步分析圖片、影像、聲音，並做出整合多樣態內容的解讀，並結合語言模型做出回應。相較於先前上市的眾多生成式AI，僅能執行單一類型，例如丟一張圖請AI判讀圖像時，不能同時判別聲音，Gemini可以同時執行的生成能力，是一大突破。

Google伺服器自2016年起導入自研晶片TPU。Google提供

為了符合Google生成式AI大計，這場發布會同步宣告Google自研晶片TPU（Tensor Processing Unit），進入下一世代v5p，配置於雲端伺服器。每個 TPU v5p Pod在最高頻寬的晶片間互連（ICI）上由 8960 個晶片組成，晶片速率為 4800 Gbps 。比上一代每秒浮點運算次數（FLOPS）提高 2 倍以上，高頻寬記憶體（HBM）提高 3 倍以上，是 Google 現今性能最佳、效率最高、擴充性最強的 TPU 系統，專為訓練頂尖 AI 模型所設計。

所以究竟為何Google可以彎道超車？自研符合自家運算架構的TPU，是重要關鍵，微軟與OpenAI少的就這一環，也難怪TPU進程是這場AI肉搏戰裡，需要秀的「肌肉」。