最近OpenAI團隊再推出ChatGPT旗下新功能Canva,以及語音對話!到底怎麼用?另外生成式AI聊天機器人ChatGPT還有網頁版、手機應用程式和蘋果桌面版,使用步驟分別是?只懂中文的人可以用嗎?免費版也能使用GPT-4o嗎?付費版ChatGPT Plus多出哪些權益?最新模型 4o mini差別在哪?《遠見》一文完整更新。並附上完整表格,迅速拆解ChatGPT各版本沒登入、有登入、有付費與免費權益比較。
ChatGPT官網如何登入?有中文版?
想要使用ChatGPT,只要造訪ChatGPT官網,即可開始和ChatGPT展開對話。
從台灣網域登入,預設介面便是繁體中文,可以在對話中以繁體或者簡體中文進行交流,ChatGPT都能夠理解,並給予回應。
因為OpenAI普及AI的願景,今年四月官方宣佈,即便沒有登入OpenAI,也能開始使用。不過,若有以信箱註冊,能夠記憶對話內容、能夠回頭尋找歷史紀錄以外,並且選擇個人設定,還可以試用進階功能。
如果你已經創設過OpenAI帳號,點擊「Login」按鈕後,就可以使用電子郵件、Google、微軟或者蘋果帳號登入;
若還沒有帳號,點擊「Sign up」,便可以遵循指示填寫資料後建立新的帳號。
不用登入帳號能使用ChatGPT,登入後也可以免費使用,目前OpenAI並沒有暫停免費使用的打算,只是付費使用者能夠表現更好的模型。
ChatGPT的中文回答速度和內容品質都比不上英文,但已經能夠幫上使用者的忙。值得注意的是,ChatGPT的簡體中文能力優於繁體中文,主要原因在於GPT系列模型的訓練資料高度集中於英文,且簡體中文資料遠多於繁體中文。因此,台灣企業和公部門團隊,萌生訓練在地版本大語言模型的想法,分別從保存文化和商業應用角度,發掘「台版GPT」的適用場景。
如果使用ChatGPT時遇上問題,OpenAI設置常見問答頁面,裡面列出「什麼是ChatGPT」、「ChatGPT如何運作」、「為什麼 AI 看起來如此真實和逼真」、「我能相信 AI 在告訴我真相嗎」等問題。
ChatGPT有App版?iOS、Android、電腦能用?如何下載安裝?
去年(2023)五月,OpenAI宣布推出ChatGPT的手機應用程式,民眾因此能夠在手機上也能使用ChatGPT的APP;今年(2024)六月,則進一步開放macOS使用者也能下載電腦版的應用程式,不再需要特別造訪ChatGPT網站。
OpenAI發表手機版本ChatGPT的文章中,提到幾個要點。
首先,它能夠在桌面和行動裝置之間同步對話記錄,提升了用戶的便利性,不用因為切換裝置從頭再來。其次,它支援OpenAI開發的語音辨識模型Whisper,可以將用戶的語音指令轉換為文字(speech-to-text),再傳送給ChatGPT。
另外,如果使用者繳納每個月20美元的月費,在手機版應用程式中能夠享有同等權利,包括使用更先進的模型、更快的對話速度,還能率先體驗新功能。應用程式也提供客製化推薦服務,根據個人需求提供旅遊計劃或食譜建議。
至於Android版用戶,OpenAI也提供相似服務,例如同步手機與電腦使用紀錄,避免出錯。
值得一提的是,因為ChatGPT是極度熱門的關鍵字,在網頁版的搜尋引擎上、在手機的應用程式市集中,鍵入ChatGPT,會看到大量名稱裡出現Chat、GPT、AI聊天的應用程式,但卻不是由OpenAI發行。因此,如果想下載官方版本應用程式,一定要確認是否由OpenAI推出,以免下載到仿冒品。
其次,即便不太介意是否為官方版本,也需注意是否收費、開發者背景及其他用戶的評價,否則可能碰上問題,尤其是在AI時代下,開發者若有心搜集對話紀錄、誘使付費但未提供相應服務,選擇應用程式時得要更謹慎才行。
就電腦版用戶來說,Mac使用者直接到OpenAI官網下載即可開始使用,不過需要將作業系統升級至macOS 14.0級以上版本,否則無法使用。
OpenAI針對電腦使用場景,同樣列出幾種應用情境,例如以快速鍵呼叫ChatGPT後,直接用電腦鏡頭拍照後上傳,或者是擷取其他應用程式的使用過程等,也能夠用語音方式對話。
今年八月,OpenAI更新桌面版本的ChatGPT,新增伴隨主程式的視窗(companion window)、增強資料分析能力、改進快速鍵(keyboard shortcuts)例如提供客製化選項等。
Canvas功能成為寫程式和寫文章新利器?
2024年10月,OpenAI宣布在ChatGPT既有的對話以外,以GPT-4o為基礎,增加新的協作方法-Canvas。在選擇模型處,使用者會看到Canvas的新選項,在此模式下ChatGPT會將輸出獨立出來,與使用者所下的指令並排,方便在反覆的對話中修改與左右對照。
OpenAI表示,Canvas非常適合寫程式碼和撰寫文章的場景,因為使用者執行任務時,會有明確想要展現的風格、改變的段落,也會有需要微調的內容,ChatGPT提供使用者調整內容長度與難度、測試程式碼以及加上表情符號,還有複製、貼上等功能,寫程式碼時也有一鍵轉換成其他程式語言,以及偵測錯誤等能力。
此外,即使使用者沒有主動打開Canvas,若ChatGPT判斷當下的互動對話適合使用,也會自動轉進Canvas,方便使用者與ChatGPT合力撰寫文章和協作開發。
經過OpenAI測試,經過Canvas處理的任務,以表現看,比單純使用GPT-4o來得更好。
熟稔生成式AI工具的使用者可能會發現,ChatGPT的Canvas和Claude的Artifacts非常相似,同樣都是從對話轉變成左右對照,將程式碼與文章輸出內容獨立出來,但Claude的突出之處在於能夠直接觀看程式碼的產出,ChatGPT目前只能自行下載程式碼後預覽。
OpenAI強調,Canvas是ChatGPT推出以來,視覺互動介面的首度重大更新,能夠看出OpenAI對它的重視。事實上,ChatGPT、Claude和Gemini等生成式AI對話工具的出現本身就是革新,因為他們同樣改變人們過去慣常自行查找資訊的方式,從反白、拖拉、複製貼上等主動索求答案,轉變成直接問答。
就撰寫文章和生成程式碼來說,的確也能透過對話獲得,但因為這兩類生產內容的過程本身需要經過大量迭代、修正,因此格外重視版本更新,但對話的長介面卻會損害生產效率,改成在每次更新時,以並置的架構方便觀察結果,對有真實在使用這兩類工具的上班族來說更有助益。
語音對話功能到哪開啟?有何用途?
今年5月,OpenAI在發布會中展示宛若《雲端情人》的語音互動模式,但中間遭控盜用知名演員史嘉蕾·喬韓森(Scarlett Johansson)的聲音,遲至9月OpenAI才陸續大規模開放語音對話。
根據OpenAI釋出的消息,現在共有兩種語音模式,第一種為Plus和Team等付費版用戶暫時獨享的進階語音模式(Advanced Voice Mode),以及只要登錄便能使用的標準語音模式(Standard Voice Mode),兩者同樣都能與ChatGPT以開口說話方式交談,並將口說內容轉成文字,差別在於進階語音模式更自然、更即時,還能考慮語言以外的線索(non-verbal cues),利如說話速度、背景等,並能夠在回應中加入情緒。
值得注意的是,進階語音模式目前僅開放行動端使用者,而標準語音模式在行動端以外,macOS的使用者也能使用。
以手機為例,只要打開ChatGPT後,點擊對話按鈕,同意應用程式取得聲音權限後,就能選擇偏好的聲音,ChatGPT有列出各個聲音對應的特質,選定後即可展開對話。
就台灣來說,ChatGPT預設會使用中文對話,但隨時能夠切換成不同語言,且ChatGPT發出聲音時也能打斷。若使用者終止對話,ChatGPT會將對話內容轉成文字,提供完整逐字稿,因此有不少使用者利用它進行語言學習,不管是做家事、讀論文,還是照顧家人時,閒來無事都能呼喊ChatGPT,與它展開對話。
新模型GPT-o1和GPT-4o怎麼用?
現在使用者只要打開ChatGPT,無論有沒有付費,登入後預設就是OpenAI新推出的GPT-4o mini與GPT-4o。只是,免費使用者在額度用罄後,從GPT-4o切換回GPT-4o mini。
今年9月,OpenAI端出強調推理能力、以思維鏈拆解任務的最新模型-o1的預覽版(o1-preview),專門用來處理複雜任務與困難問題,相對先前的更新,少了商業氣息,多了能力的深度。
再往前,今年5月OpenAI則推出GPT-4o模型。與GPT-4 turbo、GPT-4、GPT-3.5相比,它的特點和優勢在於能接受多種輸入模態、回覆速度顯著加快,以及處理特定任務上的表現變好。發佈GPT-4時,OpenAI主要強調提升回覆品質以及模型智慧,5月公布的GPT-4o,則更注重商用價值和人類互動的自然性。
從輸入模態來看,先前的GPT-4和GPT-3.5已經可以通過語音與ChatGPT互動,GPT-4o則能夠處理文字、聲音、圖像和影像;就回覆速度來說,前者的回覆延遲時間(latencies)通常在3到5秒之間,為了改善表現,OpenAI革新了處理語音和轉換成文字的流程。
GPT-4o運行時,不再需要將聲音轉換成文字再生成回覆,而是能直接在同一個模型中端到端(end-to-end)地處理文字、影像、圖像和聲音。因此,那些在原先流程中可能丟失的寶貴資訊,例如聲音中的語調、背景雜音、多個人的聲音等環境中的細節,都能被保留下來。
OpenAI強調,GPT-4o在文字生成、推理以及撰寫程式能力上,都與GPT-4 Turbo相當,而在多語言支持、聲音和視覺功能方面,也豎立新的標準。
就在GPT-4o推出的兩個月後,OpenAI在2024年7月發布小語言模型GPT-4o mini。儘管其參數(parameter)量並未公開,但從OpenAI使用「小模型(small model)」的描述來看,其參數顯然不會如前幾代旗艦模型那樣突破百億。
為何要推出小模型?其關鍵意義在於,在能力不顯著下降的情況下,以更經濟、更迅速的方式完成任務。正如OpenAI在其API說明文件中提到的那樣,GPT-4o mini是「可負擔且智慧的小型(模型)型號,適用於快速且輕量級的任務。」
對比兩年前推出、能力較弱但費用相對低廉的text-davinci-003,就每次對話都會消耗的符元(token)來說,GPT-4o mini的成本已經下降了99%,而且模型的能力還在不斷提升。李開復曾說過,「我認為未來兩年會看到(LLM應用)非常劇烈的競爭,因為百分之百確定至少還有兩代巨大的模型提升。」每次模型升級,都將推動新的應用發展,同時降低推論成本(inference cost)的定價,而OpenAI無疑是率先降低定價的強勢玩家。
|延伸閱讀:獨家專訪》李開復解讀大模型之戰!AI 2.0時代如何拚「三位一體」戰略?
ChatGPT有哪些用途?
OpenAI在其官網,列舉好幾項ChatGPT可執行的任務:
・寫作與創意發想:協助撰寫文章、提出創意、編輯內容以及探索新思路。
・會議總結與效率提升:整理會議內容,發掘關鍵見解,幫助提升工作效率。
・程式碼處理:生成和除錯程式碼,並自動化重複性的任務,甚至學習新的 API。
・學習與知識擴展:提供答案給複雜問題,學習新知識,或發展興趣愛好。
・數據分析與圖表生成:幫助分析數據並快速生成可視化圖表。
・圖像互動:上傳或拍攝圖片,然後向 ChatGPT 提問或要求分析。
・自訂工作流程:利用 GPT 來定製 ChatGPT,處理工作、日常任務或尋找靈感。
・圖像創作:根據簡單的描述或詳細的段落生成相應的圖像。
舉例來說,OpenAI表示可以下這些指令:
・請幫助我學習學測詞彙。
・請測試我對古代文明的了解。
・請替我寫一封關於邀請朋友在婚禮上擔任伴郎的簡訊。
・請幫助將對論文的想法轉換成大綱。
・告訴我一個有關羅馬帝國的趣味小故事。
・請給我一些處理孩子藝術作品的創意建議。
ChatGPT入門指令教學:如何請它翻譯,生成圖片?
打開ChatGPT介面後,最基礎的互動就是像在生活中一樣,提出簡單、清楚的問題,例如詢問ChatGPT,自己應該以工作為重,還是以生活為重?是否有辦法取得工作和生活的平衡(work-life balance)?
打開ChatGPT介面後,最基礎的互動便是如同工作和生活中一般的自然對話,提出清楚且簡單的問題。例如,你可以詢問ChatGPT,找工作時應該看中薪水,還是應該更關注自己能夠累積多少經驗?又或者,尋找人生伴侶時,該看重哪些特質?
不過,如果想得到更有用、更精準的回答,不妨考慮使用更加結構化的方法。與ChatGPT對話時,可以利用框架組織自己的提問,將指令細分為以下幾個部分:
・背景:描述你要求ChatGPT完成的任務背景,例如你的角色或你正在與誰合作,也可以將你的角色指派給ChatGPT。例如:「你是一位專業的文稿,精通中文與英文寫作,你現在正準備閱讀記者的稿件,確認是否出現任何問題。」
・任務:明確指出你希望ChatGPT幫助你完成的具體事項。不論是提供某個話題的見解,還是從文本中提取關鍵信息,都應該清楚說明。例如:「請協助審核以下這篇討論『ChatGPT應該怎麼用、帶來哪些影響』的文章,確認有沒有錯字和文意不通順之處。」
・脈絡:向ChatGPT提供任務相關的背景資訊,例如校對工作中,組織使用哪些標準字?是否有習慣的標題結構?如果有必要的背景知識,一定要提前告知。舉例來說,可以這樣下指令:「請注意,這篇文章旨在寫給『從未使用過ChatGPT的讀者』,因此請確認文章是否過度使用專有名詞,會不會太過生澀;另外,也請檢視文章是否同時列出正方和反方論點,舉的例子有沒有平衡。最後,請幫忙查看文章中有沒有達成教學的目的,不只是解釋ChatGPT的運作原理而已。」
・限制與要求:如果對ChatGPT的回答有特殊要求,應事先說明,如回答不超過200字,或希望使用專業翻譯者的風格進行撰寫;。實際例子:「檢查文章後,請以列點(bullet point)方式提出待改進之處,以及修改建議,請不要直接提供修改過後的文章。」
在使用ChatGPT時,如果有特定需求,應提前說明,例如限制回答字數在150字內、每次引用專家說法時都要完整說明受訪者頭銜。明確的語調和風格要求對提升回答品質有顯著效果,具體範例:「請檢查這篇文章後,以條列方式提供可改進的部分和建議,請勿直接給出修改後的版本。」
除了上述指令注意事項,還可以透過幾種實用技巧來提升ChatGPT的使用體驗。比如,對ChatGPT訴諸情感、使用不同ChatGPT對話視窗交叉檢視生成內容品質。如果答案不滿意,也可以持續追問。這些方法都能或多或少「逼出」ChatGPT的潛能。
ChatGPT指令進階:拆解任務更精準?
推出Claude的Anthropic撰寫官方指南,告訴開發者和使用者如何用好Claude。雖然有部分內容是想讓開發者調用Claude的應用程式介面(API)時使用,但有部分建議值得使用網頁版服務參考,且無論是ChatGPT或者Claude使用者,同樣都適用。
讓以下是官方指令撰寫指南中的重點提示:
1. 下指令時,做到直接、清晰且詳細ChatGPT就像能力優秀但剛進入公司的新員工,提供明確指示,才能讓ChatGPT了解使用者的期望。
・設定明確的角色:在指令中指派特定角色,例如「經驗豐富的資料科學家」、「財務長」或「企業法律顧問」,引導ChatGPT發揮其專業知識,根據需求調整回應。
・提供充足的背景資訊:讓ChatGPT了解任務的目的、目標受眾、相關工作流程以及成功完成任務的樣貌。
・使用清晰易懂的語言: 避免使用專業術語、行話或模糊的措辭。
・循序漸進說明指示:使用編號清單或項目符號,以確保 Claude 按照您希望的方式執行任務。
2. 運用研究者發掘出的思維鏈技巧,讓ChatGPT能夠把複雜任務拆解成子任務。
・思維鏈(chain of thought prompting):主動要求ChatGPT逐步推理,在指令中加入在提示中加入「逐步思考」(Think step-by-step),讓其自行分解任務;進階一步,能夠自行列出步驟、重要的考慮面向,讓ChatGPT能夠參考。
・提示鏈(prompt chaining):思維鏈能夠幫助使用者解決難題,不過,有些任務的複雜度太高,單純使用思維鏈還不夠,這時可以運用提示鏈,把高度複雜的任務再度拆解為單一任務,並確定個別任務的目標,任務之間則要確保ChatGPT輸出的資訊能夠傳遞到下一段任務中。
3. 提出範例、活用結構化元素,藉此增加ChatGPT的表現。
・提供多個範例(multi-shot examples):在指令中提供多個精心設計的範例,讓 ChatGPT能夠更知道自己將要產出什麼樣形式與風格的內容。確保範例與預期產出相符,並具備足夠的多樣性,且要涵蓋遊走在邊界的案例(borderline examples)。
・XML標籤:活用XML標籤標記指令中的不同段落,藉此區分不同的元素,如上下文、指示和範例。例如,表明哪一段是文件(以開頭、結尾)。
4. 其他重要技巧:
・善用長上下文提示:有些任務有大量前置資料,例如寫書摘,可以利用XML標籤標記指令不同段落的意義,並且把長篇內容放在指令上方,要求ChatGPT執行的任務、目標和範例則放在下方。
・要求引用:處理的文件長度很長時,要求ChatGPT必須在回覆時標明引用的資訊來源,減少產出幻覺的機會。
・測試和迭代:指令並不完美,唯有不斷練習,打磨自己下的指令,並借鑑優秀指令寫法,再觀察ChatGPT或者Claude的回應,藉此調整。
ChatGPT的應用商店GPTs怎麼用?
Google開設應用程式市集(App Store)後,成功建起生態系,讓開發者們可以自主貢獻應用,進而吸引使用者。蘋果則是以其封閉的牆內花園(walled garden)而聞名,將使用者緊緊地限制在蘋果品牌的護城河之中,形成了一個強大但僅限圈內人接觸的品牌體系。
對比之下,缺乏終端產品、沒有通路的OpenAI,前路便顯得艱難。它不像蘋果的硬體帝國,已然擁有手機、電腦和平板等多元通路;也不像Google的軟體帝國,牢牢把關著人們的搜尋引擎和影音平台。
在嘗試外掛(plugins)並確認使用者對查詢料理食譜、安排旅遊行程和搜尋景點等不同功能的需求後,OpenAI決定以GPT商店取代外掛,其目的就是想藉此建立以GPT模型為基礎的ChatGPT應用程式,來對抗那些擁有生態系的科技巨頭。
實際使用上,有哪些GPTs可能派得上用場,例如,專精生成圖像的圖像產生器(image generator)、能夠創造高品質文案的替我寫(Write For Me)、擅長學術研究的共識以及專門為打造Logo而生的Logo產生器(Creator),這些應用無疑提升了ChatGPT整體功能的多樣性與實用性。
想要探索GPT商店,只需點擊ChatGPT對話頁面左側的「Explore GPTs」,便能從OpenAI列出的清單中瀏覽或透過搜尋找到符合需求的GPTs。
ChatGPT付費版PLUS,企業版Team與免費版差異?
對白領使用者來說,最關心的一定是付費帶來哪些權益,而模型版本就是關注重點,因為先進模型的準確率高、回覆速度快、出現幻覺機會較少、能夠處理的模態也變多。
沒登入 | 有登入,沒付費 | 有登入,有付費 | |
---|---|---|---|
模型選項 | GPT-4o mini | GPT-4o、GPT-4o mini | GPT-4o、GPT-4o mini、GPT-4 |
模型額度 | 無限額 | GPT-4o有限額,每三小時發送16則訊息,用罄後切換回GPT-4o mini | GPT-4o有限額,每三小時發送80則訊息(ChatGPT Plus)或者160則訊息(ChatGPT Team),用罄後可選擇切回GPT-4o或者GPT-4 |
處理資料模態 | 僅文字 | 包含圖像在內的多模態;能夠生成圖像 | 包含圖像在內的多模態;能夠生成圖像 |
進階功能 | 無 | GPT-4o有資料分析、上傳檔案等進階功能,有限額 | GPT-4o有資料分析、上傳檔案等進階功能,無限額 |
資料來源:OpenAI;資料整理:曾子軒,最後更新日期:2024/09/09 |
跟個人付費版用戶比較,OpenAI表示,Team用戶包含ChatGPT Plus的全部功能,且對GPT-4o的進階功能和生成圖像都有更多額度,也能夠在團隊工作空間內建立、分享GPTs,並有團隊專用的管理員控制台,且團隊資料不會用來訓練模型。
如果說ChatGPT Team是針對團隊協作,以及小型組織而設,則ChatGPT Enterprise則是提供給OpenAI的文件顯示,無論是免費版、付費個人、團隊或者企業版,都能與ChatGPT互動,同樣能保存聊天記錄、跨網頁和應用程式存取,且倘若模型進步,品質和速度都會提升。
那麼,差異到底在哪?主要體現於模型和功能上。
功能/方案 | Free | Plus | Team | Enterprise |
---|---|---|---|---|
收費 | 0美元 | 20美元/月 | 每人30美元/月; 每人25美元/年 | 聯繫業務 |
GPT-4 mini | 無限制 | 無限制 | 無限制 | 無限制 |
GPT-4o | 有限 | 免費版五倍 | 比付費個人版多 | 無限制 |
GPT-4 完整存取 | 受限,視使用情況 | 標準 | 擴展 | 無限制 |
回應速度 | 有限,視使用情況 | 快速 | 快速 | 最快 |
上下文窗口 | 8K | 32K | 32K | 128K |
資料來源:OpenAI;資料整理:曾子軒,最後更新日期:2024/09/09 |
功能/方案 | Free | Plus | Team | Enterprise |
---|---|---|---|---|
語音輸入 | ✓ | ✓ | ✓ | ✓ |
記憶功能 | - | ✓ | ✓ | ✓ |
瀏覽功能 | 限制 | ✓ | ✓ | ✓ |
資料分析 | 限制 | ✓ | ✓ | ✓ |
圖像辨識 | 限制 | ✓ | ✓ | ✓ |
檔案上傳 | 限制 | ✓ | ✓ | ✓ |
探索和使用 GPTs | 限制 | ✓ | ✓ | ✓ |
創建與分享 GPTs | - | ✓ | ✓ | ✓ |
與團隊分享 GPTs | - | - | ✓ | ✓ |
提前存取新功能 | - | ✓ | ✓ | ✓ |
圖片生成 | - | ✓ | ✓ | ✓ |
互動表格與圖表 | - | ✓ | ✓ | ✓ |
資料來源:OpenAI;資料整理:曾子軒,最後更新日期:2024/09/09 |
隱私 | Free | Plus | Team | Enterprise |
---|---|---|---|---|
數據是否用於訓練模型 | 是,可退出 | 是,可退出 | 否 | 否 |
自訂數據保存期限 | - | - | - | ✓ |
資料來源:OpenAI;資料整理:曾子軒,最後更新日期:2024/09/09 |
去年,OpenAI透過其官方X帳號(前推特)官網,宣布推出ChatGPT的企業版,整理特點如下:
• 企業用戶可以無限制地使用GPT-4模型,其速度比網頁版快了兩倍以上。
• ChatGPT的可讀取上下文長度(context window)擴大。
• 提供可自定義並適用於企業工作流程的對話模板,確保每個企業都能根據自身需求進行最佳配置。
• 為企業版用戶提供免費的API額度,這無疑是減少成本的一大優勢,同時也增加了使用便利性。
• 支援包括Code Interpreter在內的資料分析功能和客制化選項,使得數據處理更加高效和精準。
• OpenAI承諾不利用企業資料訓練其模型。
• 企業版ChatGPT通過SOC 2認證,確保了安全性、隱私性和數據保密性。
• 允許企業在控制台中管理團隊成員,並支持網域驗證和單一登入服務。
OpenAI當時表示,自推出的九個月內,超過80%的財經五百大企業的員工使用ChatGPT。正式推出企業版服務前,OpenAI已讓早期用戶如支付公司Block、內容協作平台Canva、美妝集團雅詩蘭黛及會計師事務所資誠等試用。
OpenAI認為,推出企業版ChatGPT是幫助工作者和企業充分利用人工智慧的一大步。雖然企業版並沒有添加令人驚豔的新功能,但其重點在於打好基礎。ChatGPT的企業版推出後,除了吸引一般客戶訂閱和開發者API使用外,其對OpenAI的營收貢獻將取決於更多企業是否選擇付費服務。這不僅是技術上的進步,更是一種市場策略的調整。
然而,OpenAI面臨的挑戰依然嚴峻。正如GPT商店需要與擁有完整生態系統的Google和蘋果競爭一樣,企業版ChatGPT也必須同時應對微軟Copilot、Google Duet AI和亞馬遜Amazon Q的夾擊。此外,OpenAI強勁的對手Claude也推出了企業版服務Claude Team,競爭激烈程度可見一斑。
微軟擁有Microsoft 365,Google則有Google Workspace,而亞馬遜則具備完善的開發者生態系統,整合了大量數位資產和工作流程。市場上有多年的老將穩坐江山,同時新軍也在伺機而動。ChatGPT Tean究竟能否脫穎而出?這正是OpenAI所面臨的一大難題。
ChatGPT背後團隊:OpenAI是什麼組織,誰創立?
OpenAI是一家致力於人工智慧(artificial intelligence,簡稱AI)的企業,最初以非營利組織的身份創立。參與這個計劃的有特斯拉創辦人馬斯克(Elon Musk)、PayPal共同創辦人提爾(Peter Thiel)、LinkedIn共同創辦人霍夫曼(Reid Hoffman),以及從Y Combinator時期便已打響名號的現任執行長奧特曼(Sam Altman)。
這群來自矽谷的創業家和科技愛好者們,合力投資並創辦OpenAI的初衷是打造通用人工智慧(artificial general intelligence,簡稱AGI),在確保安全性的前提下,讓ChatGPT這類生成式AI能夠對社會帶來貢獻。
通用人工智慧,又稱為強人工智慧(strong AI),代表接近甚至超越人類能力的人工智慧,因為具備認知能力,因此可以按照一定的邏輯推理,進而完成不同類型的任務,甚至擁有自我意識。以短期和中期來看,能夠自主(autonomous)做出決策、完成行動,而且毋需人類介入的人工智慧,也就是所謂的「AI代理人」(AI Agent),就是通用人工智慧的雛形。
|延伸閱讀:AI Agent來了,但它是什麼?AI代理介紹、趨勢全解讀
不過,目前尚未出現通用人工智慧,ChatGPT何時會成為強人工智慧,又是否會危害人類安全,出現如《機械公敵》一樣的機器人對抗人類場景,始終是AI愛好者和發展者的熱議話題。
機器人學者莫拉維克(Hans Moravec)三十多年前曾提出「莫拉維克悖論」(Moravec's paradox ),他指出電腦的運算能力強大,不管是下棋或者解題,都有辦法完成,然而,卻無法跟嬰兒一樣活動,或者感知環境的變化。因此,現在市場上看到的AI,大多是侷限在單一領域,或者有著明確目標的任務,例如生產線上的品質檢測、公司上下班打卡的人臉辨識、銀行判定盜刷等。
|延伸閱讀:數位員工、人型機器人降臨人間,「AI代理」會取代你的工作?
這些應用,就是與通用人工智慧相對的應用人工智慧(applied AI),也稱為弱人工智慧(weak AI)。
早在電腦科學領域出現前,人類漫長的歷史中,不乏對於擁有人類同等能力機器人的嚮往;達特茅斯會議定義「人工智慧」以降,通用人智慧便是研究者們苦苦追尋的聖杯,卻也是難以企及的夢想。隨著演算法(algorithm)的不斷革新,再加上數位化帶動大數據(big data)的搜集成為可能,算力(computing power)也漸次累積,研究者們總算度過前一段看不見人工智慧發展意義,因此削減經費的人工智慧寒冬,迎來新的春天。
因為成本下降、技術進步,深度學習主宰人工智慧領域,也有效落地於商業場域中。只是,現在眼前所見、歸屬於弱人工智慧的應用,離科學家追求的終極目標還很遠,艾西莫夫的預言、雲端情人的美好景象尚未實現,依然是研究者心中的失落聖杯。
雖然路途還很遙遠,OpenAI並未因此止步。它不斷引入外部資金,不僅讓微軟重金押注,NVIDIA和蘋果都有可能成為新一輪的投資者;為了發展技術,OpenAI也挖掘頂尖人才,希望能朝代表終極的大門靠近,最終實現通用人工智慧的夢想。
過去幾年間,OpenAI屢有突破,在文字、視覺和聲音上都達到突破,讓研究者和實踐家同感興奮,2022年的年末,ChatGPT面向一般民眾後,不僅揭開生成式AI大戰,也讓AI競爭從幕後走到幕前。
ChatGPT背後的大語言模型原理為何?
根據 OpenAI 的說明,ChatGPT的訓練過程與早期推出的電玩遊戲機器人「OpenAI Five」有許多相似之處。它們都運用了人類的反饋增強學習(reinforcement learning)來進行訓練。這種學習方式類似於孩子玩電動的過程,雖然沒有大人手把手指導,但透過不斷嘗試和經歷失敗,孩子可以從遊戲中的回饋中逐漸學會如何進步。比如,從平台掉下或被擊飛會失分,而獲取寶物則可能加分,這些回饋幫助孩子們摸索出成功的遊戲策略。
在訓練 ChatGPT 的過程中,模型訓練者實際上同時擔任用戶和 AI 助手的兩種角色。這樣的設計有助於產生初步的對話數據,幫助模型理解基本的對話策略。接著,為了提升機器生成的回答品質,訓練者會以用戶的身份向機器提問,並根據機器的回應提供反饋,從而優化其對話能力並改善回答的準確性和表達方式。
訓練過程中,訓練者評估模型生成的多個回答,並給予評分,讓模型瞭解哪些回答較好、哪些需要改進。這些評分的回饋類似於孩子在玩遊戲時,通過獲得分數或通關來感知到的正面或負面反饋。透過這些回饋,模型可以不斷調整和優化回答策略,最終提升其對話能力。