Facebook Pixel
訂閱
快速註冊 已是會員,立即登入

為您推薦

會員權益

當ChatGPT推GPT 4 ,國科會TAIDE模型為何再戰?

曾子軒
user

曾子軒

2024-05-06

瀏覽數 3,300+

國科會組建開發本土大語言模型,全名為可信任AI對話引擎(Trustworthy AI Dialog Engine,簡稱為TAIDE,發音為台德)。取自TAIDE官網
國科會組建開發本土大語言模型,全名為可信任AI對話引擎(Trustworthy AI Dialog Engine,簡稱為TAIDE,發音為台德)。取自TAIDE官網

喜歡這篇文章嗎 ?

登入 後立即收藏 !
00:00
00:00

ChatGPT已更新到GPT-4 Turbo模型,比算力、比模型大小、比資料規模都難以和OpenAI等科技巨頭競爭,為何國科會仍要續推TAIDE?上週五(3日),TAIDE週年成果發表記者會中,主委吳政忠說了什麼?

「TAIDE這個計畫,應該至少會再一年。」國科會主委吳政忠在TAIDE週年成果發表記者會中,語帶肯定地說明。他口中的TAIDE,指的是國科會組建開發的本土大語言模型,全名為可信任AI對話引擎(Trustworthy AI Dialog Engine,簡稱為TAIDE,發音為台德)。

2023年當國科會宣布投入研發TAIDE時,曾引來質疑聲音。例如,OpenAI的GPT系列模型Google的Gemini模型都如此先進,投入國家之力,是不是只是重新發明輪子?另外,業界如台智雲、聯發科陸續也都投入大語言模型研究,政府是不是要與民爭利?

先前接受《遠見》專訪時,TAIDE計畫負責人李育杰解釋,打造本土語言模型的出發點,主要是想推動在地化,讓模型學到台灣知識與文化,同時協助中小企業。「政府不是要打造一把很厲害的武器去競爭,而是資助開源模型協助產業,」並不是想跟業界競爭。

國家投入開發在地大語言模型是不是閉門造車或者與民爭利?國科會TAIDE計畫負責人李育杰強調,政府投入模型開發並開源,推動在地與可信任,對大眾和中小企業都有幫助。曾子軒攝

國家投入開發在地大語言模型是不是閉門造車或者與民爭利?國科會TAIDE計畫負責人李育杰強調,政府投入模型開發並開源,推動在地與可信任,對大眾和中小企業都有幫助。曾子軒攝

TAIDE與GPT 4差異:通台語客語衝普惠

以合作案例而言,有學界引進TAIDE學習專有領域知識,也有產業界導入TAIDE開發客服機器人、串起內部資料,如李育杰所說,協助中小企業、降低導入成本的願景,正在緩緩成形。

舉例來說,人工智能公司董事長張榮貴分享,過去一年花費許多心力,把包含TAIDE在內的大語言模型,整合進其客服服務、CRM平台和知識管理系統。因為生成式AI的運作邏輯與特性,既有服務都能從過往的關鍵字互動轉化為對話式互動,不僅增加使用效率,自然語言介面也讓互動更加貼近真人。

張榮貴表示,已經和台企銀展開合作,讓分行面對客戶的一線人員能夠快速掌握新知,「有活動或者是優惠措施,都能很快傳達,如果有不了解的時候也可以迅速跟TAIDE詢問,」同時提升銀行行員獲取銀行知識的準度、速度和完整度。

內秋應智能科技指出,可以用地端方式使用TAIDE,而企業查找內部知識是常見應用。曾子軒攝。

內秋應智能科技指出,可以用地端方式使用TAIDE,而企業查找內部知識是常見應用。曾子軒攝。

若以和TAIDE合作的層次區分廠商類型,硬體層有群聯電子和創鑫智慧,透過調整運算架構和晶片設計上,降低模型訓練和運作成本;模型部署層則有台智雲,將TAIDE在內的各家開源模型整合到平台上,方便客戶利用。

應用層的企業端,則有人工智能(Ai3)、內秋應智能科技(精誠資訊子公司)和叡揚資訊,主要將TAIDE用在提升工作效率如撰寫公文、整合公司內部資訊如建立知識庫,以及將其作為客服機器人的對話引擎當中。

至於學術端,包含陽交大、成大、興大和政大等校,有些將重點擴展TAIDE的語言能力如台語和客語,有些則是專攻司法、農業等特定領域。

陽明交大在TAIDE之上,開發出能夠「聽懂」國語、台語、客語和英文及其他語言的功能,達到TAIDE團隊期望的普惠應用願景。曾子軒攝

陽明交大在TAIDE之上,開發出能夠「聽懂」國語、台語、客語和英文及其他語言的功能,達到TAIDE團隊期望的普惠應用願景。曾子軒攝

【7月空中沙龍】會員免費參加>>半導體產業如何成為護國群山?

TAIDE勝GPT 4:可幫中小企省錢

其實,不管是硬體層、模型部署層還是應用層,都不是非TAIDE不可,例如硬體層最常見的展示案例為Meta的LLama系模型,模型部署層廠商也都在嘗試Mistral系模型,應用端則可以串連閉源微軟/OpenAI的GPT系、Google的Gemini模型。

不過,TAIDE有專門針對繁體中文和可信任兩個面向下功夫,對廠商來說,合作起來,多出TAIDE,就是多一個能夠講好中文的模型選項。

李育杰便提到,最開始想開發具備中文能力、有台灣風格的通用基礎模型,就是希望由政府負擔持續預訓練(continued pre-training)的成本,中小企業導入時便能受惠,同時因為背負國家隊名號,應用時需要更加謹慎,因此花費不少心思在改善模型的偏見與歧視上。

李育杰強調,為了達到TAIDE名稱中的「Trustworthy」(可信任),團隊額外花了許多時間測試、改進模型。曾子軒攝

李育杰強調,為了達到TAIDE名稱中的「Trustworthy」(可信任),團隊額外花了許多時間測試、改進模型。曾子軒攝

中研院院士孔祥重也補充,TAIDE不可或缺之處在於,它經過繁體中文微調(fine-tuning),因此能夠貼合台灣文化與價值,同時更有著服務公眾的特性。

從李育杰和孔祥重的說法觀之,TAIDE定位和業界開發大語言模型的初衷和用途,有著截然不同的定位。

TAIDE計畫再戰一年,因為已有成果

今年4月,TAIDE陸續釋出奠基於LLama 2、可商用的7B和學研用的13B模型,在Meta推出LLama 3模型後,團隊也快速推出奠基於Llama 3的測試版模型。

吳政忠表示,過去一年已經看到TAIDE的發展成果,已經能夠作為各行各業向前進的引擎(engine),希望未來科技辦公室能夠持續推動,至少讓這個原定一年期、在4月底完成階段性任務的計畫,能夠再維持一年,繼續打磨TAIDE、讓它更貼近台灣的土壤。

對於未來TAIDE發展,孔祥重指出,鼓勵政府繼續推動計畫,另外他也希望建立機制,包含制訂貼合在地價值觀(value)和安全性的評斷基準(benchmarks),以及透過攻擊演練(red teaming)模擬真實使用場景,藉此確保我們能夠信任模型。

孔祥重期許,TAIDE和圍繞產生的社群能夠成為台灣生成式AI的知識聚落,並進一步討論政策、倫理和社會面和生成式AI彼此如何交織。曾子軒攝。

孔祥重期許,TAIDE和圍繞產生的社群能夠成為台灣生成式AI的知識聚落,並進一步討論政策、倫理和社會面和生成式AI彼此如何交織。曾子軒攝。

國科會的資源比不上有微軟支持的OpenAI,單就顯卡數量也拼不過新創如Mistral,但TAIDE仍舊找出自己的玩法,就看在國科會帶領下,TAIDE能夠行得多遠、走到哪個方向。

延伸閱讀

AI教父黃仁勳的創業領導成功之道
數位專題

AI教父黃仁勳的創業領導成功之道

AI晶片巨頭輝達(NVIDIA)執行長黃仁勳勢不可擋!1993年創立輝達以來,公司市值近來創下歷史新高,黃仁勳身價更是破千億美元榮登全球前15大富豪。隨著Computex 2024登場,他帶來的A

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務