不讓ChatGPT 4o專美於前,Claude,在短短三個月之內推出最新版本Claude 3.5。同樣端出更快的處理速度,並預期將有更長的上下文token容量和記憶能力。此外,新功能Artifacts為何更適合上班族協作?究竟Claude怎麼使用?一秒復刻自己想模仿的網頁,以及速讀圖表等3大絕佳用法實測,《遠見》不藏私呈現。
Claude AI是什麼?
Claude是由Anthropic推出的AI模型,也是一款能與人類對話的AI互動服務。使用者可以像操作ChatGPT一樣,直接在網站上與Claude進行互動,也可以透過Claude API進行企業內部的開發應用。
根據Anthropic官網介紹,Claude在處理文字方面擅長多種任務。它能生成包括文件、信件、問答等大量內容,也能編輯、重寫、摘要和分類這些內容。此外,Claude還能自然地與人對話,扮演不同角色,就像與真人交流一樣。由於訓練資料龐大,它精通多種語言,熟悉程式撰寫,並能回答涉及各種文化和專業領域的問題。最後,Claude還能將工作流程自動化,根據使用者指令有邏輯地解決任務。
值得注意的是,Claude無法自行造訪網頁,使用者需要從外部貼入資訊與它互動。Claude遵循Anthropic的理念,致力於生成有幫助、誠實且無害的內容。這一原則被稱為「HHH」(Helpful, Honest, and Harmless),並通過特別的訓練手法,確保它能符合開發者的期望。
Anthropic曾表示,Claude 3模型的網路訓練資料截止日期(cutoff date)為2023年8月,Claude 3.5模型則為2024年4月。除了網際網路公開資料以外,Anthropic也另外使用第三方的非公開資料、Anthropic的用戶資料以及資料標記公司的資料,用來訓練Claude模型。
Claude 3.5有多強大?Artifacts新功能是什麼?
今年3月,Anthropic一共推出三款Claude 3系列模型,分別是Claude 3 Haiku(俳句)、Claude 3 Sonnet(十四行詩)以及 Claude 3 Opus(古典樂的編號作品)。
這次釋出的是性能居中的Claude 3.5 Sonnet模型,Anthropic也表示,今年稍後就會釋出Claude 3.5 Haiku和 Claude 3.5 Opus模型。
根據Anthropic自行檢測,在推理能力、數學能力、大學生程度的知識上,Claude 3.5 Sonnet全面勝過Meta、Google和OpenAI等對手,不管是OpenAI春季發表會釋出的GPT-4o,還是Google的Gemini 1.5 Pro,以及Meta(臉書母公司)的Llama-400B,都無法和Claude 3.5 Sonnet匹敵。
考慮到多模態的趨勢,Anthropic再度補上Claude 3.5 Sonnet的視覺能力納入比較,宣稱其仍舊勝過所有對手。Anthropic強調,即便圖像中的文字有缺陷,Claude 3.5 Sonnet仍可以轉錄文字,這在物流、零售和金融場景中,大有助益。
事實上,在2024生成式AI年會上,專攻物流的艾立運能數據長陳凱翔便提到,過往都會利用光學字元辨識(OCR)處理的大量手寫字的出貨單據,現在則可以利用增添視覺能力的基礎模型處理。
對熟悉各大企業生成式AI服務的用戶來說,「最強模型」的自我標榜已經不再稀奇,但實際效果仍需市場驗證。
國際間評比大語言模型的知名榜單、由柏克萊大學營運的LMSYS,才剛放上Claude 3.5 Sonnet,但因為測試時長還不夠,尚未進入榜單。不過,AI程式結對開發(pair programming)服務Aider指出,Claude 3.5 Sonnet只花費兩天,就已經登上程式碼編輯排行榜首位,勝過OpenAI的GPT-4o。
在改寫與翻譯程式碼上加分不少
對比Anthropic 3月和6月的兩波更新,上次改進回答的正確性、更精準判斷使用者意圖、增加多模態能力、提供結構化的輸出格式與函數呼叫功能等;這次則增加Artifacts功能、增加回答速度,且在生成、改寫和「翻譯」程式碼上下了不少心思。
從以前到現在,Claude便非常強調其模型超長的上下文,以及極短的回答時間。
對於客服和電商的企業用戶來說,若對話機器人在調用API時耗時過長,讓客戶久等並感到不耐煩,這樣的服務毫無價值。因此,Anthropic認為檢索知識和自動化銷售將會是未來的重要戰場。
不過,就在Google I/O上,Google向大眾介紹調整架構後,規模較小但回覆速度較快的Gemini 1.5 Flash模型,在吸納符元(token,以下交替使用符元和token)長度上也先開放100萬的長度,未來將會開放至200萬,研究中的進度則達到1000萬。OpenAI的GPT-4o也同樣追求低延遲性(latency),對Anthropic帶來極大挑戰。
Anthropic指出,目前Claude 3.5 Sonnet提供20萬個符元的上下文長度。這是什麼意思呢?token指的是電腦理解文字的最小單元,詞彙、句子和段落都能成為token。而Claude 3.5和GPT-4的說明文件中的token,則是比詞彙更小的單元。根據OpenAI介紹,每個token約等同於4個英文字母的長度,或者是0.75個單字。至於中文,每個字就是一個token。
因此,若以一篇500字的英文文章、一篇1000字的中文文章來說,Claude 3.5 Sonnet能夠處理300篇英文文章,或者200篇中文文章,實力驚人。而且,Anthropic先前便提到,單論模型能力,Claude 3實際上能接受超過100萬個token,因此可以預期實力最強的Claude 3.5 Opus,應該也有處理百萬級token的實力。
實際使用付費版ChatGPT和Claude 3.5時,可以發現後者處理長文的速度極快,而且不會遺漏長文的中間與末段,非常適合處理如學術研究、產業報告等長篇文件;此外,加上Artifacts功能後,使用者可以更細緻調整程式碼,對生產力很有幫助。
ChatGPT、Gemini與Claude各模型處理能耐比較 | |
模型 | API處理token數量(萬) |
Claude 3.5(標準版) | 20 |
Claude 3(額外付費) | 100 |
Claude 3(標準版) | 20 |
Claude 2 | 10或20 |
GPT-4o | 12.8 |
GPT-4 | 8或12.8 |
GPT-3.5 | 0.4或1.6 |
Gemini 1.5 Pro(額外付費) | 100 |
Gemini 1.5 Pro(標準版) | 12.8 |
Gemini 1.0 | 3.2 |
註:模型能夠處理的token數量可能會隨企業推出新版本而改變;Claude主要以context window稱呼 資料來源:OpenAI、Google、anthropic官網|整理:曾子軒 |
當大語言模型的回答速度和上下文長度已經成為紅海、價格戰的硝煙也被點起之時,Anthropic端出新功能:Artifacts(人造物、人工品)。
根據Anthropic介紹,當使用者利用Claude產出程式碼、網站設計或者文字時,Claude會獨立出一個動態、可以立即見到生成成果的分隔視窗,讓人能夠即時調整生成內容。
Anthropic強調,這讓Claude再也不是對話式的AI服務,更要走向協作的工作環境(collaborative work environment),增加團隊合作的可能性。可以預期,Claude除了付費版的Claude Pro、讓AWS和Google Cloud支援的開發者調用模型以外,也有望推出類似Copilot或者ChatGPT Team的服務,加入工作的多人合作場景競爭中,讓Claude成為隊友(teammate)。
Claude台灣如何開設帳戶?Claude如何使用、Artifacts功能怎麼用?
打開Claude的頁面後,只需輸入電子信箱或使用Google帳號,即可開始註冊程序。
除了輸入姓名外,還需提供手機號碼以接收認證簡訊,通過後才能使用Claude。
在使用前,Anthropic會提醒使用者可能遇到的情況,例如生成誤導性資訊或冒犯性內容。
註冊完成後,即可開始使用Claude。目前Claude背後預設的模型是最新版本Claude 3.5。除了進行一般問答外,Claude還提醒使用者可以上傳照片與圖像,並從中萃取有效資訊;同時也會在首次開啟Claude時,詢問是否開啟Artifacts功能。
實測1:解析長文
就像ChatGPT一樣,我們可以展開問答,不過,使用Claude的最大重點,自然是其記憶能力,它能夠接收比ChatGPT更長的上下文長度(context window)。
若有解析長文的需求,尤其是檔案頁數多的PDF,例如論文、研究報告或者長篇作品,都可以上傳到Claude處理。
不過,作為大型語言模型,再加上沒有開啟連網功能,Claude仍無法避免產出幻覺。ChatGPT已經在近期做出不少努力,減少幻覺,Claude的更新中,也提到出現幻覺次數正在下降中,模型會明確拒絕,或是和使用者確認提問內容,藉此避免無中生有。
實測2:快速看圖表
實測Claude 3.5的多模態結果,表現亦佳。上傳2024年總統大選的政黨得票地圖,Claude能夠精確解釋圖表的意義,不只能辨識圖上的說明,也能夠讀懂圖例中的顏色尺度(scale)和其對應的數值。
至於本次更新的一大亮點Artifacts,實測效果不俗。
實測3:秒複製網頁
上傳《遠見雜誌》記者的文章頁面,再請Claude撰寫前端程式碼,除了因為無法聯網因此沒有辦法復刻出照片以外,其餘包含標題、摘要和日期等都有成功再製,網站上方的文章頻道和訂閱按鈕等亦然。
此外,即便截圖圖檔尺寸很小,Claude也無懼於文字難以辨認的挑戰,一字不差地再現。
因為再製頁面缺乏作者名稱與日期,也沒有原先官網有的文章蒐藏功能,要求Claude補上,它也從善如流,順利完成要求。
目前Claude付費版、每月收費20美元的Claude Pro,已經開放台灣使用者付費使用。相對於免費版的使用次數限制,Claude Pro用戶擁有五倍的對話額度,且提供使用者調取速度更快的Claude 3 Haiku以及先前性能最優異的Claude 3 Opus模型。
跟ChatGPT Plus相似,當網站流量太大時,Claude Pro使用者也擁有使用的優先權,往後開放功能時也能搶先體驗。
Anthropic打造出Claude,背後創辦者是OpenAI舊將
Anthropic的創辦人達里歐(Dario Amodei)和丹尼耶菈(Daniela Amodei)兄妹,在創立Anthropic之前,曾在開發ChatGPT的OpenAI擔任高階主管。哥哥達里歐擔任研發副總裁,妹妹丹尼耶菈則擔任安全與政策副總裁。
根據Venture Beat報導,兄妹兩人因無法認同OpenAI接受微軟10億美元投資,並大幅向產業轉型的發展路線,於2021年離開公司,並帶走9名員工,共同成立Anthropic。他們計畫打造一個更透明、更值得信任的人工智慧系統。與他們相似的是特斯拉創辦人馬斯克,他同樣因為不認同OpenAI的資本化路線,選擇退出OpenAI。
如今看向OpenAI發展,的確與達里歐和丹尼耶菈兄妹的想法漸行漸遠。
The Information報導指出,OpenAI執行長奧特曼(Sam Altman)正在考慮改變OpenAI原先複雜的組織架構,從非營利性質完全轉變為營利,讓公司中的營利組織,不用再受到非營利組織的董事會管理,藉此和Anthropic、馬斯克的xAI競爭。
目前未上市的OpenAI估值(private valuation)達到860億美元,若根據過去半年的收入數字計算年化收入(annualized revenue,將特定時間區間收入轉換為全預估收入),已經成達到34億美元。
另外,曾對奧特曼發動逼宮、現已離開OpenAI的前首席科學家薩斯凱博(Ilya Sutskever)也在上週(6/19)宣布,創辦以開發安全的超級智慧為宗旨(Safe Superintelligence,SSI)的同名公司。
I am starting a new company: https://t.co/BG3K3SI3A1
— Ilya Sutskever (@ilyasut) June 19, 2024
OpenAI的前首席科學家薩斯凱博宣布創辦SSI公司。
與OpenAI對比之下,安全與信任始終是Anthropic的核心宗旨。達里歐和丹尼耶菈雙雙入選時代雜誌的「AI百大影響人物」榜單,對兩人來說,確保人工智慧系統與人類價值觀對齊(human value alignment)是最重要的事。這一點使他們在眾多致力於AI技術與應用的企業中顯得格外突出。
在機器學習領域,AI做決策的過程經常被形容為黑盒子(black box)。因此,很多研究者致力於打開這個黑盒子,解析AI決策的原因,推出能夠解釋的AI(explainable AI),並增加機器的可詮釋性(mechanistic interpretability)。達里歐和丹尼耶菈正是這些研究者之一。
觀察Anthropic的發展歷程,可以發現它與OpenAI有某種程度的相似。Anthropic將自己定位為一個專注於AI安全研究的實驗室(AI safety-research lab)。然而,為了打造先進的模型,他們需要大量算力。因此,Anthropic也進行了募資,並將模型使用權授權給投資者和客戶使用,做法和OpenAI相似。
不同的是,Anthropic的企業結構並不像OpenAI。Anthropic是一家公益公司(public benefit corporation,PBC),優先考慮社會和公共利益,這與一般的營利性企業不同。這意味著,他們不需要過多擔心投資者要求取得財務回報的壓力,也不會受到強大合作夥伴的過度影響。
Google、Amazon不只自己開發模型,也都出手投資Anthropic
根據Crunchbase資料,包括Google、Amazon、FTX創辦人SBF(Sam Bankman-Fried)、前Google執行長施密特(Eric Schmidt)、臉書共同創辦人莫斯科維茲(Dustin Moskovitz)等人都對Anthropic進行了投資。
2021年5月,Skype開發工程師塔林(Jaan Tallinn)領投了A輪,注資約1.24億美元。塔林曾投資孕育出AlphaGo和AlphaFold、後來被Google收購,如今已經成為Google發展人工智慧技術核心的DeepMind,並且非常關注人工智慧對人類的存在風險(existential risk),他參與創立了英國劍橋大學的存在風險研究中心以及美國的未來生命研究所。後者即是馬斯克(Elon Musk)日前參與連署「停止先進AI系統開發6個月」倡議的組織。
2022年4月,臭名昭著的加密貨幣交易所FTX創辦人兼執行長SBF領投了B輪,注資約5.8億美元。2023年2月,Google宣佈投資Anthropic 3億美元,獲得約10%股份,除了發展自家的Bard(現已更名為Gemini)外,也希望Claude能夠對抗ChatGPT。
2023年5月,由Spark Capital領投的C輪中,Google和Zoom也參與,共投資4.5億美元。2023年8月,韓國電信公司SK電信也投資1億美元,希望能打造適合電信公司的大語言模型。
2023年9月,Amazon宣佈將投資Anthropic高達40億美元。對Anthropic來說,AWS將成為公司依賴的雲端服務商,類似OpenAI利用微軟的算力與資金,Anthropic能夠將這些新資源用於改善模型的穩定性與性能。Amazon則如同微軟,透過AWS將Anthropic的模型開放給客戶使用。
2024年6月,就在Anthropic釋出Claude 3.5 Sonnet模型後,Google Cloud和AWS各自迅速宣布,旗下生成式AI開發平台Vertex AI和Amazon Bedrock,皆已經開放取用Claude 3.5 Sonnet。
AWS表示,美國餐飲外送龍頭 DoorDash已利用Claude 3模型,打造出由以生成式AI技術為基底的客服中心(customer support center)。目前此類AI代理(AI agent,亦翻譯為AI智能體、AI助理或者AI專員)已在客服產業逐漸擴散,預計將應用在更多領域。
Claude AI訓練過程中有何特色?
由於公司創辦人的信念,Claude的設計顯得非常有原則性。
在Claude的訓練過程中,開發者先制定了一些稱為「憲法AI」(Constitutional AI)的原則,讓機器能夠遵守。在第一階段,Anthropic先讓模型生成內容,然後讓模型自我批判,並根據批判來修正生成內容,藉此調整模型生成內容的方向。在這個階段中,模型會根據人類制定的原則,評價自己的回答內容,因此屬於監督式學習。第二階段則是從微調後的模型生成內容,再使用其他模型進行「二選一」評判,利用其他模型來評估生成內容的優劣,藉此訓練出偏好模型。
如果熟悉OpenAI訓練ChatGPT的過程,應該會記得「從人類回饋中強化學習」(reinforcement learning from human feedback,簡稱RLHF)這個階段,也就是請人類標記者評價生成內容的好壞,而Anthropic則是讓AI來代替人類進行評價,因此稱為「從AI回饋中強化學習」(reinforcement learning from AI feedback,簡稱RLAIF)。
其實,Claude的訓練過程與ChatGPT相似,都是從標記資料以及人類或機器的回饋中學習與改進。然而,Claude在一開始就制定出原則,使AI有了可以遵循的依據,生成內容能夠體現制定者(人類)的價值觀,從而減少人類標記者潛在的偏見。
不會造成傷害的AI助理
透過這樣的訓練過程,Anthropic訓練出了一個不會造成傷害,但也不會逃避問題的AI助理,即便使用者蓄意詢問潛在危險的問題,例如ChatGPT明確禁止涉及犯罪與暴力的內容,Claude仍然能夠提出反駁。Anthropic強調,他們提升了AI決策的透明度,讓人類可以更精確地控制AI的行為,同時卻不會增加人工干預,可謂一舉數得。