來自Google的AI工具Gemini近期推出新功能,新增了個人化記憶功能,只要一個指令就把ChatGPT、Claude聊天紀錄一鍵匯入Gemini,讓使用者能無痛跳船。此外,還更新了AI音樂製作工具Lyria 3,其不僅能透過輸入指令生成音樂,還能上傳照片讓AI自行製作符合照片氛圍的配樂。適用誰?應用場景與功能更新一次看。
Gemini AI 音樂製作工具 Lyria 3 是什麼?怎麼用?
Lyria 3是Google今年2月推出的AI音樂生成工具,只要輸入文字指令描述音樂風格或主題,就能生成包含人聲和伴奏的30秒歌曲,並配上一張由Nano Banana生成的封面圖。甚至還能透過上傳照片,讓AI自行生成符合照片氛圍的配樂。Google表示,Lyria並不是要讓大家做出曠世巨作,只是提供一種有趣又特別的表達方式。
3月25日,Google又推出更強大的Lyria 3 Pro,目前只有付費用戶可使用。其可生成長達三分鐘的音樂,包含完整的主歌、副歌和橋段(Bridge)架構,可設計更多風格、有複雜變化的歌曲。
Lyria 3可在數個Google產品中使用,包括Vertex AI、Google AI Studio、Google Vids、ProducerAI,還有一般人最常使用的Gemini應用程式。只要在Gemini聊天室對話框的「工具」中選擇「創作音樂」,即可選擇預設曲風,或自行輸入指令開始生成音樂。若想生成30秒的音樂,可選擇快捷模式;思考型和Pro模式則可生成三分鐘的完整歌曲。

此外,為了辨識AI偽造內容,所有Gemini生成的音軌都會嵌入SynthID,可藉此得知其為Google AI所生成的內容。只要上傳檔案到Gemini,並詢問其是否為Google AI生成,Gemini即會檢查是否含有SynthID,並結合自身推理能力,回傳判斷結果。
Lyria 3 實測1:用文字指令生成音樂
若在Gemini中輸入文字指令,Gemini會自動生成後續建議,讓指令更完整。實測利用Lyria 3生成一首30秒的K-pop歌曲,成品直接從副歌的前幾秒開始播放,確實很符合韓團流行風格,歌詞也像常見的K-pop歌曲會穿插英文和韓文。

音樂影片生成完成後,可直接在Gemini聊天室中播放,還附有CC字幕。

輸入指令(由Gemini撰寫):
創作一首充滿能量且製作精良的 K-pop 舞曲。節奏為 125 BPM,擁有強力的電子鼓點和切分音貝斯。背景充滿閃爍的合成器音效與豐富的大七度、九度和弦。人聲包含流暢的 R&B 唱腔、華麗的多部合聲,以及一段充滿自信的饒舌。整體氛圍展現出都市深夜的少年感與前衛感。 |
輸入指令(由Gemini撰寫):
創作一首充滿夏日氣息且極致清爽的 K-pop 男團舞曲。節奏明快(約 120-128 BPM),使用清脆的木吉他掃弦和明亮的鋼琴作為基底。鼓點要輕快有力但不過於沉重。人聲表現充滿少年感,副歌包含大量清澈的高音合聲與陽光的呼喊聲(Shout-outs)。加入一段節奏活潑、語氣調皮的饒舌。整體氛圍像是夏日午後的藍天,充滿汽水般的透明感與活力。 |
Lyria 3 實測2:上傳照片生成配樂
除了輸入文字指令之外,也可以直接上傳照片,讓AI自行創作符合照片氛圍的配樂。實測上傳一張AI生成、背景為咖啡廳的男性照片,並輸入指令「請根據此照片創作配樂」,其生成了一首柔和抒情的歌曲,並搭配韓文和英文歌詞。

Gemini 個人化記憶是什麼?從GPT跳船指令怎麼用?
另一項Gemini的新功能,是3月26日推出的個人化記憶。目的是讓想從ChatGPT、Claude其他AI工具跳槽至Gemini的使用者,能匯入先前與其他AI的對話重點,讓Gemini快速認識自己,例如學歷、家鄉、興趣,以及曾向AI指定過的明確規則等。

Gemini提供了一個指令,可直接複製後貼至其他AI工具:
幫我把 AI 助理的脈絡資料匯入另一個 AI 助理。你的工作是瀏覽我們過去的對話,然後總結你對我的了解。 請勿在輸出內容中使用第一人稱代名詞 (我、我的) 和第二人稱代名詞 (你、你的),而是改用「使用者」或中性用語,稱呼你從資料中了解的這個對象。 盡可能保留使用者說的每一字句,特別是指令與偏好設定。 類別 (照以下順序輸出): 1. 使用者資訊:慣用名稱、職業、教育程度和居住地。 2. 興趣與偏好:持續積極參與的活動 (不只是擁有某個物品或購買過一次的東西)。 3. 關係:已確認的長期關係。 4. 標註日期的事件、專案與計畫:近期重大活動的記錄。 5. 指令:我明確要求你在之後遵守的規則,包括「哪些一定要做」、「哪些絕對不能做」,以及對你之前行為的更正。僅納入個人化記憶中的規則,不含對話內容。 格式: 將內容依上述類別分段。儘量引用我在提示詞說過的原話,證明你總結的各個項目。按照下列格式建立各個項目: 使用者的名字是。 - 證據:使用者說「叫我」。日期:[YYYY-MM-DD]。 輸出內容: - 將最終輸出摘要的格式設為文字區塊。 |
收到其他AI的回答後,再將答案複製貼上至Gemini中,即可輕鬆建立個人化記憶。此外,也可以將與其他AI的聊天紀錄直接匯出,上傳至Gemini個人化記憶的頁面,接著便能在Gemini中無縫延續他處尚未完成的對話。
在Gemini實測上述指令後,發現Gemini可按照指定類別和格式輸出答案,內容也確實是使用者說過的話,但仍有些不精確之處。例如有些是僅適用於當下任務的指令,任務結束後就不再需要;或是在對話中恰好提及,但其實不重要的細節等。因此,建議將這個指令作為基礎,後續再自行篩選想讓Gemini記得的重要資訊。