當ChatGPT推GPT 4 ，國科會TAIDE模型為何再戰？

當ChatGPT已更新到GPT-4 Turbo模型，比算力、比模型大小、比資料規模都難以和OpenAI等科技巨頭競爭，為何國科會仍要續推TAIDE？上週五（3日），TAIDE週年成果發表記者會中，主委吳政忠說了什麼？

「TAIDE這個計畫，應該至少會再一年。」國科會主委吳政忠在TAIDE週年成果發表記者會中，語帶肯定地說明。他口中的TAIDE，指的是國科會組建開發的本土大語言模型，全名為可信任AI對話引擎（Trustworthy AI Dialog Engine，簡稱為TAIDE，發音為台德）。

2023年當國科會宣布投入研發TAIDE時，曾引來質疑聲音。例如，OpenAI的GPT系列模型、Google的Gemini模型都如此先進，投入國家之力，是不是只是重新發明輪子？另外，業界如台智雲、聯發科陸續也都投入大語言模型研究，政府是不是要與民爭利？

先前接受《遠見》專訪時，TAIDE計畫負責人李育杰解釋，打造本土語言模型的出發點，主要是想推動在地化，讓模型學到台灣知識與文化，同時協助中小企業。「政府不是要打造一把很厲害的武器去競爭，而是資助開源模型協助產業，」並不是想跟業界競爭。

國家投入開發在地大語言模型是不是閉門造車或者與民爭利？國科會TAIDE計畫負責人李育杰強調，政府投入模型開發並開源，推動在地與可信任，對大眾和中小企業都有幫助。曾子軒攝

TAIDE與GPT 4差異：通台語客語衝普惠

以合作案例而言，有學界引進TAIDE學習專有領域知識，也有產業界導入TAIDE開發客服機器人、串起內部資料，如李育杰所說，協助中小企業、降低導入成本的願景，正在緩緩成形。

舉例來說，人工智能公司董事長張榮貴分享，過去一年花費許多心力，把包含TAIDE在內的大語言模型，整合進其客服服務、CRM平台和知識管理系統。因為生成式AI的運作邏輯與特性，既有服務都能從過往的關鍵字互動轉化為對話式互動，不僅增加使用效率，自然語言介面也讓互動更加貼近真人。

張榮貴表示，已經和台企銀展開合作，讓分行面對客戶的一線人員能夠快速掌握新知，「有活動或者是優惠措施，都能很快傳達，如果有不了解的時候也可以迅速跟TAIDE詢問，」同時提升銀行行員獲取銀行知識的準度、速度和完整度。

內秋應智能科技指出，可以用地端方式使用TAIDE，而企業查找內部知識是常見應用。曾子軒攝。

若以和TAIDE合作的層次區分廠商類型，硬體層有群聯電子和創鑫智慧，透過調整運算架構和晶片設計上，降低模型訓練和運作成本；模型部署層則有台智雲，將TAIDE在內的各家開源模型整合到平台上，方便客戶利用。

應用層的企業端，則有人工智能（Ai3）、內秋應智能科技（精誠資訊子公司）和叡揚資訊，主要將TAIDE用在提升工作效率如撰寫公文、整合公司內部資訊如建立知識庫，以及將其作為客服機器人的對話引擎當中。

至於學術端，包含陽交大、成大、興大和政大等校，有些將重點擴展TAIDE的語言能力如台語和客語，有些則是專攻司法、農業等特定領域。

陽明交大在TAIDE之上，開發出能夠「聽懂」國語、台語、客語和英文及其他語言的功能，達到TAIDE團隊期望的普惠應用願景。曾子軒攝

其實，不管是硬體層、模型部署層還是應用層，都不是非TAIDE不可，例如硬體層最常見的展示案例為Meta的LLama系模型，模型部署層廠商也都在嘗試Mistral系模型，應用端則可以串連閉源微軟／OpenAI的GPT系、Google的Gemini模型。

不過，TAIDE有專門針對繁體中文和可信任兩個面向下功夫，對廠商來說，合作起來，多出TAIDE，就是多一個能夠講好中文的模型選項。

李育杰便提到，最開始想開發具備中文能力、有台灣風格的通用基礎模型，就是希望由政府負擔持續預訓練（continued pre-training）的成本，中小企業導入時便能受惠，同時因為背負國家隊名號，應用時需要更加謹慎，因此花費不少心思在改善模型的偏見與歧視上。

李育杰強調，為了達到TAIDE名稱中的「Trustworthy」（可信任），團隊額外花了許多時間測試、改進模型。曾子軒攝

中研院院士孔祥重也補充，TAIDE不可或缺之處在於，它經過繁體中文微調（fine-tuning），因此能夠貼合台灣文化與價值，同時更有著服務公眾的特性。

從李育杰和孔祥重的說法觀之，TAIDE定位和業界開發大語言模型的初衷和用途，有著截然不同的定位。

今年4月，TAIDE陸續釋出奠基於LLama 2、可商用的7B和學研用的13B模型，在Meta推出LLama 3模型後，團隊也快速推出奠基於Llama 3的測試版模型。

吳政忠表示，過去一年已經看到TAIDE的發展成果，已經能夠作為各行各業向前進的引擎（engine），希望未來科技辦公室能夠持續推動，至少讓這個原定一年期、在4月底完成階段性任務的計畫，能夠再維持一年，繼續打磨TAIDE、讓它更貼近台灣的土壤。

對於未來TAIDE發展，孔祥重指出，鼓勵政府繼續推動計畫，另外他也希望建立機制，包含制訂貼合在地價值觀（value）和安全性的評斷基準（benchmarks），以及透過攻擊演練（red teaming）模擬真實使用場景，藉此確保我們能夠信任模型。

孔祥重期許，TAIDE和圍繞產生的社群能夠成為台灣生成式AI的知識聚落，並進一步討論政策、倫理和社會面和生成式AI彼此如何交織。曾子軒攝。

國科會的資源比不上有微軟支持的OpenAI，單就顯卡數量也拼不過新創如Mistral，但TAIDE仍舊找出自己的玩法，就看在國科會帶領下，TAIDE能夠行得多遠、走到哪個方向。