Spotify 推出支援 ElevenLabs 的 AI 自助出版有聲書工具
目錄
您可能想知道的事
Spotify 這項由 ElevenLabs 驅動的新工具將如何改變作者製作與發行有聲書的方式?
Spotify 還會推出哪些額外的平台功能與市場擴展來支持有聲書與創作者?
主要主題
在最近的投資者日簡報中,Spotify 宣布在其 Spotify for Authors 平台內新增一項以 AI 為驅動的功能,讓作者可以使用 ElevenLabs 的語音技術生成有聲書。該功能計劃在六月以受邀制的方式進入有限測試階段,初期僅接受邀請。Spotify 表示測試階段將先支援英文輸出。此功能建立在 Spotify 與 ElevenLabs 之間既有的合作關係上,延伸了先前允許使用 ElevenLabs 工具製作的音訊提交到 Spotify 目錄的安排。
這項新的自助出版功能旨在給予作者更大的彈性:Spotify 強調使用 ElevenLabs 驅動生成工具的作者不會被排他性發行協議所約束。換言之,創作者仍可在除了 Spotify 之外的其他平台發布他們的 AI 生成有聲書。對許多作者而言,這種非排他模式在降低嘗試合成敘述的門檻的同時,仍保留了更廣泛的發行選擇。
Spotify 整合 ElevenLabs 語音模型的動機,很可能來自於希望擴大可供使用的更自然且富於表情的合成語音存取。ElevenLabs 因其對話流暢且情感細膩的輸出而受到關注,這項合作讓 Spotify 能透過整合的工作流程向作者提供這些進展。值得注意的是,ElevenLabs 自身在 2025 年推出了面向作者的自助出版服務,顯示雙方都視面向作者的工具為策略性成長領域。
除了 ElevenLabs 的公告之外,Spotify 還公布了一系列針對其有聲書生態系統的更廣泛擴展。Spotify for Authors 入口將新增對另外十種語言的支援,包括法語、加拿大法語、德語、荷蘭語、拉丁美洲西班牙語、瑞典語、芬蘭語、冰島語、丹麥語和挪威語。這些語言新增旨在讓作者工具與支援資源更具全球可及性,使創作者能接觸更廣泛的受眾。
Spotify 也計劃演進其產品與訂閱方案。公司將在今年晚些時候擴展其 Audiobook+ 計劃,以允許更高的收聽上限,並在未來推出針對學生與家庭的客製選項。公告中未說明價格與具體使用條款等細節。Spotify 報告稱 Audiobook+ 產品已超過一百萬訂閱,並有望為該服務產生約一億美元的年化經常性收入,顯示商業吸引力正在增長。
在發掘面向,Spotify 推出了一項自然語言查詢功能,幫助使用者更直觀地找到有聲書。此外,平台將在今年夏天把現有基於提示的歌單建立功能——先前適用於音樂與播客——擴展至包括有聲書。這些功能與 Spotify 旨在透過會話式與生成式搜尋技術改善跨音頻格式內容發現的更廣策略一致。
Spotify 多年來一直在投資有聲書內容與基礎建設。公司報告其有聲書目錄已透過國際推展、支援非英語作品、啟用應用內購買以及發布有聲書排行榜,成長至約 700,000 本書目。年內,Spotify 也在美國與英國推出一項試點計劃,允許作者銷售實體書,擴展與其音訊內容相關的商務機會。根據 Spotify,這些舉措幫助有聲書收聽時數同比增加約 60%,且現有的有聲書聽眾中超過一半是在過去一年內開始接觸有聲書的。
這項關鍵洞見顯著影響對 Spotify 做法的理解: 公司正結合改進的創作者工具、非排他發行、擴展的語言支援與發現功能,以加速平台上有聲書的供應與需求。整體而言,這些舉措顯示 Spotify 希望將自己定位為一個對創作者友好且發現機制豐富的口語內容市場。
關鍵洞見表
| 面向 | 描述 |
|---|---|
| 新的 AI 有聲書工具 | 一項由 ElevenLabs 驅動、在 Spotify for Authors 平台內的受邀制測試,用於生成 AI 敘述有聲書(先支援英文)。 |
| 發行條款 | 作者不受排他性限制,且可以在其他地方發布生成的有聲書。 |
| 語言擴展 | Spotify for Authors 將新增包含法語、德語、西班牙語變體與數種北歐語言在內的 10 種語言支援。 |
| 產品與訂閱 | Audiobook+ 計劃將擴展以提供更高上限,並在未來推出學生/家庭選項;價格尚未公布。 |
| 發現功能增強 | 自然語言有聲書搜尋與將有聲書納入基於提示的歌單生成功能以改善發現。 |
| 目錄與成長 | 約 70 萬本書目與超過一百萬名 Audiobook+ 訂閱者;收聽時數年增約 60%。 |
之後⋯⋯
展望未來,有數項技術與政策領域值得探索,以在管理風險的同時實現 AI 生成有聲書的潛力。在技術面,改進語音個人化、多語言合成以及讓作者容易控制語調與節奏的工具,將提升創作表現與聽眾體驗。整合健全的編輯工作流程與品質檢查,將有助於確保合成敘述達到專業標準。
從權利與政策角度,釐清授權、語音肖像的同意以及歸屬標準至關重要。平台與語音模型供應商應與作者、旁白與權利持有人合作,制定關於訓練資料來源與允許使用情境的透明指引。對合成音訊的檢測與浮水印研究也可協助保護創作與表演者權利,同時遏止濫用。
最後,可及性與發現仍然是關鍵。持續投資於多語介面、元資料標準與會話式發現工具,將使有聲書在全球更容易被發現。微妙強調:優先保障創作者控制、透明的權利管理與改進的發現機制,將是 AI 驅動口語內容可持續成長的核心。