Claude近期讓科技人紛紛從ChatGPT跳船變新歡!最近開發團隊Anthropic也跟上OpenAI腳步,推出企業版Claude Enterprise;在手機上也能使用。到底如何官網註冊這個生成式AI工具Claude?免費版和付費版Claude差在哪?新功能Artifacts的超強預覽功能,為何能減少冗長會議增進同事協作?《遠見》一文完整比較優缺點。
Claude AI是什麼?
Claude是由獲得亞馬遜和Google等科技巨頭支持的Anthropic所開發的AI對話服務,這個名稱不僅代表該服務本身,也指背後驅動它的AI 模型。使用者可以造訪其網站,就像使用ChatGPT一樣與Claude互動;開發者也能調用Claude API,開發企業內部應用。
根據Anthropic官方的介紹,Claude能夠處理各類文字相關任務,無論是生成文件、撰寫信件,還是回答問題,它都能應對,Claude還擁有編輯、重寫、摘要和分類技能。對話中,它能模擬各種角色,讓互動過程更加自然和真實。由於Claude的訓練基於大量資料,它擅長多種語言,並且熟練掌握程式撰寫,能夠解決涉及文化、技術、專業領域的複雜問題。此外,Claude能根據使用者指令,自動化完成工作流程,有條理地解決各類任務。
然而,Claude無法直接訪問網頁,因此使用者需要手動貼入相關資訊與它進行互動。Claude遵循Anthropic的理念,致力於生成有幫助、誠實且無害的內容。這一原則被稱為「HHH」(Helpful, Honest, and Harmless)。Anthropic採用特殊的訓練方法,確保Claude符合其標準。
Anthropic曾明確表示,Claude 3模型的網路訓練資料截止日期(cutoff date)為2023年8月,Claude 3.5模型則延續至2024年4月。除了使用公開的網絡資料,Claude還依賴第三方非公開資料、Anthropic自身的用戶數據以及專業標記公司提供的資料進行訓練。
Claude台灣如何設帳戶?手機版也能用?
隨著Claude陸續更新,現在使用者分別能在網頁版、Android手機和蘋果手機上使用Claude。Anthropic尚未推出電腦版的應用程式。
Anthropic指出,使用者可以接續先前的對話,跨越平台使用Claude,且支援拍攝照片與上團圖片的視覺功能、擁有對應多語言如翻譯等能力,且使用「進階推理」一詞描述Claude的能耐。
如果是使用網頁版,打開Claude的頁面後,只需輸入電子信箱或使用Google帳號,即可開始註冊程序。
除了輸入姓名外,還需提供手機號碼以接收認證簡訊,通過後才能使用Claude。
在使用前,Anthropic會提醒使用者可能遇到的情況,例如生成誤導性資訊或冒犯性內容。
註冊完成後,即可開始使用Claude。目前Claude背後預設的模型是最新版本Claude 3.5。除了進行一般問答外,Claude還提醒使用者可以上傳照片與圖像,並從中萃取有效資訊;同時也會在首次開啟Claude時,詢問是否開啟Artifacts功能。
Claude如何使用?
實測1:解析長文
就像ChatGPT一樣,我們可以展開問答,不過,使用Claude的最大重點,自然是其記憶能力,它能夠接收比ChatGPT更長的上下文長度(context window)。
若有解析長文的需求,尤其是檔案頁數多的PDF,例如論文、研究報告或者長篇作品,都可以上傳到Claude處理。
不過,作為大型語言模型,再加上沒有開啟連網功能,Claude仍無法避免產出幻覺。ChatGPT已經在近期做出不少努力,減少幻覺,Claude的更新中,也提到出現幻覺次數正在下降中,模型會明確拒絕,或是和使用者確認提問內容,藉此避免無中生有。
實測2:快速看圖表
實測Claude 3.5的多模態結果,表現亦佳。上傳2024年總統大選的政黨得票地圖,Claude能夠精確解釋圖表的意義,不只能辨識圖上的說明,也能夠讀懂圖例中的顏色尺度(scale)和其對應的數值。
至於本次更新的一大亮點Artifacts,實測效果不俗。
實測3:秒複製網頁
上傳《遠見雜誌》記者的文章頁面,再請Claude撰寫前端程式碼,除了因為無法聯網因此沒有辦法復刻出照片以外,其餘包含標題、摘要和日期等都有成功再製,網站上方的文章頻道和訂閱按鈕等亦然。
此外,即便截圖圖檔尺寸很小,Claude也無懼於文字難以辨認的挑戰,一字不差地再現。
因為再製頁面缺乏作者名稱與日期,也沒有原先官網有的文章蒐藏功能,要求Claude補上,它也從善如流,順利完成要求。
目前Claude付費版、每月收費20美元的Claude Pro,已經開放台灣使用者付費使用。相對於免費版的使用次數限制,Claude Pro用戶擁有五倍的對話額度,且提供使用者調取速度更快的Claude 3 Haiku以及先前性能最優異的Claude 3 Opus模型。
跟ChatGPT Plus相似,當網站流量太大時,Claude Pro使用者也擁有使用的優先權,往後開放功能時也能搶先體驗。
實測4:比較方案
生活中時常需要「比較」,可能是比較手機資費,或者是比較各家保險公司的方案差異,這次實際以Claude不同的收費方案為標的測試。
打開Anthropic官網的收費頁面,抓取網頁畫面後,直接上傳到Claude對話中。
Claude很快能夠從圖像中辨識出四種方案的權益,且它能夠把「優於免費版」自動延伸為新的欄位,對於撰寫表格上非常有幫助。
Claude推出企業版,跟ChatGPT Team、Copilot對打?
2024年9月,Anthropic宣布推出Claude企業版(Claude for Enterprise),讓工作團隊能夠在協作中使用Claude。
Anthropic主要鎖定兩大方向,第一是幫助團隊工作提升效率,第二是確保團隊開發時能夠保證安全。
就提升效率來說,和OpenAI的ChatGPT、Google Workspace以及微軟Copilot相似,Anthropic強調,要讓Claude能夠整合組織內部的知識,藉此放大其能力,跨越不同專案和團隊,藉此更有效推動決策進行,而不再只是孤懸於網頁上的海上小島。
對比小型團隊使用的Claude Team,Claude企業版的亮點在於更長的上下文脈絡(context window),達到500k,個人與團隊僅有200k,方便團隊成員上傳大量公司內部自有檔案,讓Claude能夠學習;Claude企業版也整合GitHub,方便開發者能夠同步其儲存庫(即repo)裡面的程式碼。
根據Claude官網介紹,目前已有Midjourney、GitLab和Airtable等企業正在使用Claude企業版本。
提升效率以外,團隊開發時確保安全也是重點,Anthropic列出幾個讓Claude企業版使用的功能,包含單一登入 (SSO)和網域擷取:安全管理使用者存取並集中設定控制、跨域身分識別管理系統(SCIM)、按照使用者角色開放對應權限等功能。
Claude免費版和付費的Pro、Team、Enterprise有何差異?
比較Claude免費版,以及付費版的Pro、五人以上小型團隊的Team以及五百人以上的企業級Enterprise,差異體現在模型和使用優先順序上。
計劃類型 | Free | Pro | Team | Enterprise |
每月費用 | 0美元 | 20美元/月 | 每人25美元/月 | 聯繫業務 |
適用對象 | 適合初學者 | 適合進階用戶 | 適合快速成長的團隊 | 適合大型企業 |
平台存取 | 網頁、iOS、Android | 網頁、iOS、Android | 網頁、iOS、Android | 網頁、iOS、Android |
詢問文件和圖片 | ✓ | ✓ | ✓ | ✓ |
Claude 版本 | Claude 3.5 Sonnet | Claude 3.5 Sonnet, Claude 3 Opus, Haiku | Claude 3.5 Sonnet, Claude 3 Opus, Haiku | Claude 3.5 Sonnet, Claude 3 Opus, Haiku |
使用量 | 標準 | 比免費版多 | 比Pro多 | 比Team多 |
上下文窗口 | 視用量而定 | 200k+ | 200k+ | 500k |
使用優先權 | 標準 | 優先使用,免費版五倍 | 優先使用 | 更優先使用 |
早期功能存取 | - | ✓ | ✓ | ✓ |
中央帳單管理與行政功能 | - | - | ✓ | ✓ |
資料來源:Anthropic;資料整理:曾子軒。最後更新日期:2024/09/10 |
Claude 3.5有多強大?Artifacts新功能為何?
2024年3月,Anthropic一共推出三款Claude 3系列模型,分別是Claude 3 Haiku(俳句)、Claude 3 Sonnet(十四行詩)以及 Claude 3 Opus(古典樂的編號作品)。
2024年6月,Anthropic釋出的是性能居中的Claude 3.5 Sonnet模型,Anthropic也表示,今年稍後就會釋出Claude 3.5 Haiku和 Claude 3.5 Opus模型。
根據Anthropic自行檢測,在推理能力、數學能力、大學生程度的知識上,Claude 3.5 Sonnet全面勝過Meta、Google和OpenAI等對手,不管是OpenAI春季發表會釋出的GPT-4o,還是Google的Gemini 1.5 Pro,以及Meta(臉書母公司)的Llama-400B,都無法和Claude 3.5 Sonnet匹敵。
根據6月時Anthropic的自我評估,Claude 3.5 Sonnet在推理能力、數學運算以及大學生水準的知識表現上,全面超越其主要競爭對手,包括 OpenAI、Google 和 Meta 當時的最新模型。無論是 OpenAI 在春季發布的 GPT-4o、Google 的 Gemini 1.5 Pro,還是 Meta(Facebook 母公司)的 Llama-400B,都無法與 Claude 3.5 Sonnet相抗衡。
隨著多模態技術的趨勢日益顯著,Anthropic進一步將Claude 3.5 Sonnet的視覺能力納入比較範疇,並聲稱它同樣超越了所有競爭者。特別是在處理圖像中的缺陷文字時,Claude 3.5 Sonnet 仍能精確轉錄,這項功能對物流、零售和金融等行業的應用場景極具價值。
以台灣在地案例來說,2024年生成式 AI 年會上,專注於物流的艾立運數據長陳凱翔提到,過去使用光學字元辨識(OCR)技術來處理大量手寫的出貨單據,如今可以藉助具備視覺能力的基礎 AI 模型來完成,這就是大語言模型技術進展帶動垂直領域應用的明確案例。
對熟悉各大企業生成式AI服務的用戶來說,「最強模型」的自我標榜已經不再稀奇,但實際效果仍需市場驗證。
就模型表現來看,2024年9月初造訪國際間評比大語言模型的知名榜單、由柏克萊大學營運的LMSYS時,Claude 3.5 Sonnet的綜合能力排名第六,落後給8月推出的GPT-4o最新版本、8月推出的Gemini 1.5 Pro最新版本、8月推出的Grok-2最新版本,也輸給5月就推出的GPT-4o版本。考慮到Claude 3.5 Sonnet是6月才放上,若放上新版誰輸誰贏還很難說。
另外,AI程式結對開發(pair programming)服務Aider指出,Claude 3.5 Sonnet只花費兩天,就已經登上程式碼編輯排行榜首位,勝過OpenAI的GPT-4o。
在改寫與翻譯程式碼上加分不少
對比Anthropic 3月和6月的兩波更新,上次改進回答的正確性、更精準判斷使用者意圖、增加多模態能力、提供結構化的輸出格式與函數呼叫功能等;這次則增加Artifacts功能、增加回答速度,且在生成、改寫和「翻譯」程式碼上下了不少心思。
從以前到現在,Claude便非常強調其模型超長的上下文,以及極短的回答時間。
對於客服和電商的企業用戶來說,若對話機器人在調用API時耗時過長,讓客戶久等並感到不耐煩,這樣的服務毫無價值。因此,Anthropic認為檢索知識和自動化銷售將會是未來的重要戰場。
不過,就在Google I/O上,Google向大眾介紹調整架構後,規模較小但回覆速度較快的Gemini 1.5 Flash模型,在吸納符元(token,以下交替使用符元和token)長度上也先開放100萬的長度,未來將會開放至200萬,研究中的進度則達到1000萬。OpenAI的GPT-4o也同樣追求低延遲性(latency),對Anthropic帶來極大挑戰。
Anthropic指出,目前Claude 3.5 Sonnet提供20萬個符元的上下文長度。這是什麼意思呢?token指的是電腦理解文字的最小單元,詞彙、句子和段落都能成為token。而Claude 3.5和GPT-4的說明文件中的token,則是比詞彙更小的單元。根據OpenAI介紹,每個token約等同於4個英文字母的長度,或者是0.75個單字。至於中文,每個字就是一個token。
因此,若以一篇500字的英文文章、一篇1000字的中文文章來說,Claude 3.5 Sonnet能夠處理300篇英文文章,或者200篇中文文章,實力驚人。而且,Anthropic先前便提到,單論模型能力,Claude 3實際上能接受超過100萬個token,因此可以預期實力最強的Claude 3.5 Opus,應該也有處理百萬級token的實力。
實際使用付費版ChatGPT和Claude 3.5時,可以發現後者處理長文的速度極快,而且不會遺漏長文的中間與末段,非常適合處理如學術研究、產業報告等長篇文件;此外,加上Artifacts功能後,使用者可以更細緻調整程式碼,對生產力很有幫助。
推出者 | 模型 | API處理token數量(萬) |
Anthropic | Claude 3.5 Sonnet | 20 |
Anthropic | Claude 3 Opus | 20 |
Anthropic | Claude 3 Sonnet | 20 |
OpenAI | GPT-4o-mini | 12.8 |
OpenAI | GPT-4o | 12.8 |
OpenAI | GPT-4-turbo | 12.8 |
OpenAI | GPT-4 | 8或12.8 |
Gemini 1.5 Pro | 200 | |
Gemini 1.5 Flash | 100 | |
註:模型能夠處理的token數量可能會隨企業推出新版本而改變;Claude主要以context window稱呼 資料來源:OpenAI、Google、anthropic官網;資料整理:曾子軒。最後更新時間:2024/09/09 |
當大語言模型的回答速度和上下文長度已經成為紅海、價格戰的硝煙也被點起之時,Anthropic端出新功能:Artifacts(直譯為人造物、人工品)。
Artifacts新功能的3點優勢
根據Anthropic介紹,當使用者利用Claude產出程式碼、網站設計或者文字時,Claude會獨立出一個動態,讓你可以跟同事一起在開會時,比其他工具快速完成以下這些事情:
1. 用Claude討論一個網頁或者文章的構思,同步透過Artifacts做出預覽網頁或者文章
2. 以獨立畫面呈現讓一起合作的同事參考,更容易讓對方看懂並交流。
3. 若覺得已經夠好,能直接一鍵下載答案,不需要在混雜著聊天訊息中尋找答案轉貼複製。
Anthropic強調,這讓Claude再也不是對話式的AI服務,更要走向協作的工作環境(collaborative work environment),增加團隊合作的可能性。可以預期,Claude除了付費版的Claude Pro、讓AWS和Google Cloud支援的開發者調用模型以外,也有望推出類似Copilot或者ChatGPT Team的服務,加入工作的多人合作場景競爭中,讓Claude成為隊友(teammate)。
Anthropic打造出Claude,背後創辦者是OpenAI舊將
Anthropic的創辦人達里歐(Dario Amodei)和丹尼耶菈(Daniela Amodei)兄妹,在創立Anthropic之前,曾在開發ChatGPT的OpenAI擔任高階主管。哥哥達里歐擔任研發副總裁,妹妹丹尼耶菈則擔任安全與政策副總裁。
根據Venture Beat報導,兄妹兩人因無法認同OpenAI接受微軟10億美元投資,並大幅向產業轉型的發展路線,於2021年離開公司,並帶走9名員工,共同成立Anthropic。他們計畫打造一個更透明、更值得信任的人工智慧系統。與他們相似的是特斯拉創辦人馬斯克,他同樣因為不認同OpenAI的資本化路線,選擇退出OpenAI。
如今看向OpenAI發展,的確與達里歐和丹尼耶菈兄妹的想法漸行漸遠。
The Information報導指出,OpenAI執行長奧特曼(Sam Altman)正在考慮改變OpenAI原先複雜的組織架構,從非營利性質完全轉變為營利,讓公司中的營利組織,不用再受到非營利組織的董事會管理,藉此和Anthropic、馬斯克的xAI競爭。
目前未上市的OpenAI估值(private valuation)達到860億美元,若根據過去半年的收入數字計算年化收入(annualized revenue,將特定時間區間收入轉換為全預估收入),已經成達到34億美元。
另外,曾對奧特曼發動逼宮、現已離開OpenAI的前首席科學家薩斯凱博(Ilya Sutskever)也在上週(6/19)宣布,創辦以開發安全的超級智慧為宗旨(Safe Superintelligence,SSI)的同名公司。
與OpenAI對比之下,安全與信任始終是Anthropic的核心宗旨。達里歐和丹尼耶菈雙雙入選時代雜誌的「AI百大影響人物」榜單,對兩人來說,確保人工智慧系統與人類價值觀對齊(human value alignment)是最重要的事。這一點使他們在眾多致力於AI技術與應用的企業中顯得格外突出。
在機器學習領域,AI做決策的過程經常被形容為黑盒子(black box)。因此,很多研究者致力於打開這個黑盒子,解析AI決策的原因,推出能夠解釋的AI(explainable AI),並增加機器的可詮釋性(mechanistic interpretability)。達里歐和丹尼耶菈正是這些研究者之一。
觀察Anthropic的發展歷程,可以發現它與OpenAI有某種程度的相似。Anthropic將自己定位為一個專注於AI安全研究的實驗室(AI safety-research lab)。然而,為了打造先進的模型,他們需要大量算力。因此,Anthropic也進行了募資,並將模型使用權授權給投資者和客戶使用,做法和OpenAI相似。
不同的是,Anthropic的企業結構並不像OpenAI。Anthropic是一家公益公司(public benefit corporation,PBC),優先考慮社會和公共利益,這與一般的營利性企業不同。這意味著,他們不需要過多擔心投資者要求取得財務回報的壓力,也不會受到強大合作夥伴的過度影響。
Google、Amazon皆投資開發出Claude的Anthropic
根據Crunchbase資料,包括Google、Amazon、FTX創辦人SBF(Sam Bankman-Fried)、前Google執行長施密特(Eric Schmidt)、臉書共同創辦人莫斯科維茲(Dustin Moskovitz)等人都對Anthropic進行了投資。
2021年5月,Skype開發工程師塔林(Jaan Tallinn)領投了A輪,注資約1.24億美元。塔林曾投資孕育出AlphaGo和AlphaFold、後來被Google收購,如今已經成為Google發展人工智慧技術核心的DeepMind,並且非常關注人工智慧對人類的存在風險(existential risk),他參與創立了英國劍橋大學的存在風險研究中心以及美國的未來生命研究所。後者即是馬斯克(Elon Musk)日前參與連署「停止先進AI系統開發6個月」倡議的組織。
2022年4月,臭名昭著的加密貨幣交易所FTX創辦人兼執行長SBF領投了B輪,注資約5.8億美元。2023年2月,Google宣佈投資Anthropic 3億美元,獲得約10%股份,除了發展自家的Bard(現已更名為Gemini)外,也希望Claude能夠對抗ChatGPT。
2023年5月,由Spark Capital領投的C輪中,Google和Zoom也參與,共投資4.5億美元。2023年8月,韓國電信公司SK電信也投資1億美元,希望能打造適合電信公司的大語言模型。
2023年9月,Amazon宣佈將投資Anthropic高達40億美元。對Anthropic來說,AWS將成為公司依賴的雲端服務商,類似OpenAI利用微軟的算力與資金,Anthropic能夠將這些新資源用於改善模型的穩定性與性能。Amazon則如同微軟,透過AWS將Anthropic的模型開放給客戶使用。
2024年6月,就在Anthropic釋出Claude 3.5 Sonnet模型後,Google Cloud和AWS各自迅速宣布,旗下生成式AI開發平台Vertex AI和Amazon Bedrock,皆已經開放取用Claude 3.5 Sonnet。
AWS表示,美國餐飲外送龍頭 DoorDash已利用Claude 3模型,打造出由以生成式AI技術為基底的客服中心(customer support center)。目前此類AI代理(AI agent,亦翻譯為AI智能體、AI助理或者AI專員)已在客服產業逐漸擴散,預計將應用在更多領域。
Claude AI訓練過程中有何特色?
由於公司創辦人的信念,Claude的設計顯得非常有原則性。
在Claude的訓練過程中,開發者先制定了一些稱為「憲法AI」(Constitutional AI)的原則,讓機器能夠遵守。在第一階段,Anthropic先讓模型生成內容,然後讓模型自我批判,並根據批判來修正生成內容,藉此調整模型生成內容的方向。在這個階段中,模型會根據人類制定的原則,評價自己的回答內容,因此屬於監督式學習。第二階段則是從微調後的模型生成內容,再使用其他模型進行「二選一」評判,利用其他模型來評估生成內容的優劣,藉此訓練出偏好模型。
如果熟悉OpenAI訓練ChatGPT的過程,應該會記得「從人類回饋中強化學習」(reinforcement learning from human feedback,簡稱RLHF)這個階段,也就是請人類標記者評價生成內容的好壞,而Anthropic則是讓AI來代替人類進行評價,因此稱為「從AI回饋中強化學習」(reinforcement learning from AI feedback,簡稱RLAIF)。
其實,Claude的訓練過程與ChatGPT相似,都是從標記資料以及人類或機器的回饋中學習與改進。然而,Claude在一開始就制定出原則,使AI有了可以遵循的依據,生成內容能夠體現制定者(人類)的價值觀,從而減少人類標記者潛在的偏見。
不會造成傷害的AI助理
透過這樣的訓練過程,Anthropic訓練出了一個不會造成傷害,但也不會逃避問題的AI助理,即便使用者蓄意詢問潛在危險的問題,例如ChatGPT明確禁止涉及犯罪與暴力的內容,Claude仍然能夠提出反駁。Anthropic強調,他們提升了AI決策的透明度,讓人類可以更精確地控制AI的行為,同時卻不會增加人工干預,可謂一舉數得。