Facebook Pixel
訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

Google新模型Gemini:得分勝ChatGPT!更像真人

羅之盈
user

羅之盈

2023-12-07

瀏覽數 4,800+

AI人工智慧戰局進入新回合!網路巨頭Google搶快,本周推出殺手級應用「Gemini」,讓人驚喜的內容生成效益,可望讓Google一度搖晃的地位,稍稍穩定下來。取自Google Blog
AI人工智慧戰局進入新回合!網路巨頭Google搶快,本周推出殺手級應用「Gemini」,讓人驚喜的內容生成效益,可望讓Google一度搖晃的地位,稍稍穩定下來。取自Google Blog
00:00
00:00

傳言卡關延宕的Google新AI大型語言模型Gemini,外界本來預測會直接延至2024年第一季,沒想到意外地在本周(12/6)閃電登場。Gemini一系列意想不到的AI生成能力,這回可能換剛滿一歲的ChatGPT緊張了。因據測試看來,Google似乎略勝一籌。另外,在這領域的測驗,Gemini能力也超越人類。

AI人工智慧戰局進入新回合!網路巨頭Google搶快,本周推出殺手級應用「Gemini」,讓人驚喜的內容生成效益,可望讓Google一度搖晃的地位,稍稍穩定下來。

「這是我們目前為止最強大、最通用的模型,在很多領先的基準測試裡都展現最先進的性能,」Google 暨 Alphabet 執行長皮蔡( Sundar Pichai)表示。

Google Demind 執行長哈薩比斯( Demis Hassabis)則言,「我們發現 Gemini Ultra 在大型語言模型(LLM) 研究和開發中,廣泛採用的 32 個學術基準測試中,有 30 個取得了超越當前的最先進基準的效能」。

誰是「當前的最先進基準的效能」?說的就是競爭對手OpenAI最新版本GPT-4。《Business insider》引述Google高層說法,在MMLU 是測試裡,Gemini模型得分為 90.0%,擊敗了 OpenAI 的 GPT-4 的 86.4%。

從Gemini首波揭露的6分鐘影片來看,Gemini可以流暢的與人類進行語音對話,不僅能辨識人類正在手繪的簡圖,例如一隻藍色的鴨子,也能辨識真實物件,例如橘子、餅乾、毛線球。

有趣的是,Gemini不僅能描述圖形、圖片、影片,甚至可以提出符合情境的衍生問題,並且帶入英語以外的語言,辨識能力優異,例如中文發音的四聲音階,都可細緻分辨。Gemini展現的「個性」有如其名:雙子座,談吐幽默風趣,互動過程讓人經驗,真的是比真人更像真人。

Gemini在多領域的全知測驗裡「超越人類」

Gemini首度出現名號,是在今年五月Google I/O開發者大會,當時OpenAI 運營的ChatGPT來勢洶洶,Google首波迎戰的同類大型語言模型(LLM)「Bard」首場戰役居於下風,隨即推出第二波產品PaLM2應戰,並一口氣揭露下一波Gemini計畫。

知識與美味同行,遠見請客西堤

皮蔡指出,現在數以百萬計的人,每天都在我們的各種產品裡使用生成式 AI,做到一年前做不到的事情,無論是替更複雜的問題尋找答案,或是用新的工具來協作和創造,「這樣的動能令人驚豔,但是我們探索這段旅程的各種可能性,其實才正要開始」。

今日(12/6)Gemini在美國發布,Google幾乎同時進行線上的全球媒體發布會,包括英國、日本、韓國、台灣、中國等國記者,第一時間見證Gemini的誕生。Gemini 1.0 版本的模型,計畫推出三種應用規模的產品,包括功能最強大、為高度複雜的任務而設計的Gemini Ultra;適合擴展、橫跨各種類型的任務的Gemini Pro:以及處理裝置上的任務最有效率的模型Gemini Nano。後兩項本月開放給外界申請使用,最高階的Gemini Ultra預計明年登場。

Gemini採用 MMLU (大規模多任務語言理解;massive multitask language understanding)當作基準測試的方法,讓 Gemini 利用推理能力,在回答難題前更仔細地思考,比起僅使用第一印象的評估方式有顯著進化。

Google DeepMind 產品副總裁柯林斯( Eli Collins)表示,在 MMLU測試裡,結合數學、物理、歷史、法律、醫學和倫理學等 57 個主題,測試模型對世界的理解還有解決問題的能力,「Gemini Ultra 以 90.04% 的高得分,成為第一個在 MMLU 測試裡超越人類專家的模型」。

Gemini關鍵競爭力是「多模態」,隱形助力則是它

整體觀察Gemini發展,關鍵競爭力在於「multimodal多模態」系統,它可以同步分析圖片、影像、聲音,並做出整合多樣態內容的解讀,並結合語言模型做出回應。相較於先前上市的眾多生成式AI,僅能執行單一類型,例如丟一張圖請AI判讀圖像時,不能同時判別聲音,Gemini可以同時執行的生成能力,是一大突破。

Google伺服器自2016年起導入自研晶片TPU。Google提供

Google伺服器自2016年起導入自研晶片TPU。Google提供

為了符合Google生成式AI大計,這場發布會同步宣告Google自研晶片TPU(Tensor Processing Unit),進入下一世代v5p,配置於雲端伺服器。每個 TPU v5p Pod在最高頻寬的晶片間互連 (ICI)上由 8960 個晶片組成,晶片速率為 4800 Gbps 。比上一代每秒浮點運算次數 (FLOPS)提高 2 倍以上,高頻寬記憶體 (HBM)提高 3 倍以上,是 Google 現今性能最佳、效率最高、擴充性最強的 TPU 系統,專為訓練頂尖 AI 模型所設計。

所以究竟為何Google可以彎道超車?自研符合自家運算架構的TPU,是重要關鍵,微軟與OpenAI少的就這一環,也難怪TPU進程是這場AI肉搏戰裡,需要秀的「肌肉」。

延伸閱讀

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務