Когда Spotify перестал быть просто плеером
Слушаешь подкаст про квантовые вычисления и думаешь: "А почему я сам не могу сделать такой же, но про свою курсовую?" Раньше ответ был простым: микрофон, монтаж, дикция, часы работы. Теперь Spotify закинул в эту кухню CLI-инструмент, который генерирует готовый эпизод из текста за пару команд. Никаких аудиоредакторов. Никаких дублей. Просто терминал и промпт.
Встречайте PodAgent CLI — официальный инструмент Spotify для создания персональных аудиосессий с помощью агентов ИИ. Он появился на GitHub в апреле 2026 года и уже собрал 12 тысяч звезд. Я потратил вечер, чтобы разобраться, как это работает, и теперь делюсь инструкцией, после которой вы тоже сможете запилить свой AI-подкаст до завтрака.
Важно: инструмент пока в beta, требует API-ключ Spotify for Developers и подписку Spotify Premium (для загрузки в каталог). Но генерация и локальное прослушивание — бесплатны.
Что умеет PodAgent и почему он хоронит старые подходы
PodAgent — это не просто TTS с настройками. Это мультиагентная система, которая:
- Анализирует ваш исходный текст (статья, заметки, PDF) и выделяет ключевые темы
- Генерирует сценарий с учётом выбранного жанра — интервью, лекция, дискуссия двух ведущих, сторителлинг
- Синтезирует речь с эмоциональной окраской (удивление, ирония, сарказм — работают все ползунки)
- Добавляет звуковые эффекты и фоновую музыку из библиотеки Spotify (или вашу собственную)
- Экспортирует в формат MP3/WAV и сразу публикует в Spotify for Podcasters
В основе — комбинация последних моделей OpenAI (GPT-5 для сценария) и Google (Gemini 4 Ultra для анализа тональности), а аудио генерируется через собственный движок Spotify на базе ElevenLabs v3 и Meta Voicebox 2. Всё это скрыто за одной CLI-командой.
Установка: три команды, и вы в игре
Никаких зависимостей на полгигабайта. PodAgent работает через npm и требует Python 3.12+ для постобработки аудио. Запускаем:
npm install -g podagent-cli
podagent login --spotify-client-id YOUR_ID --spotify-client-secret YOUR_SECRET
podagent init MyFirstPodcast
Первая команда ставит CLI, вторая — авторизует ваш Spotify-аккаунт (ключи берутся из Spotify for Developers), третья создаёт папку проекта с дефолтным конфигом.
Промпт, который творит магию
Самый интересный файл — prompt.md в корне проекта. В нём вы описываете, какой подкаст хотите получить. Вот реальный пример, который я использовал для генерации 7-минутного эпизода про нейросети в медицине:
# Prompt for PodAgent
Source: https://example.com/ai-medicine-2026.md (или путь к локальному файлу)
Format: conversation (two hosts)
Tone: curious, slightly sarcastic, accessible for non-experts
Duration: 6-8 minutes
Music: "Synthwave Chill" (from Spotify library)
Host1: Alex — tech journalist, loves metaphors
Host2: Jamie — skeptic who asks dumb questions
Intro: Start with a rhetorical question about robot doctors
После этого запускаем генерацию:
podagent generate --prompt prompt.md --output ./episode1.mp3
Через 2-3 минуты вы получаете готовый файл. Звучит пугающе натурально — ведущие перебивают друг друга, хохочут, делают паузы. Моя жена, не знавшая о трюке, спросила: "Это кто? Новый подкаст Варламова?"
Ошибка новичка: не указывать источник. Если просто написать "сделай подкаст про ИИ" — получите бред уровня "нейросети заменят всех врачей". Чем конкретнее исходный материал, тем осмысленнее диалог.
Сравнение с NotebookLM и другими
Google NotebookLM умеет генерировать подкасты из документов с лета 2024, но там вы не контролируете ни голоса, ни длительность, ни стиль. PodAgent даёт настоящую артиллерию настроек. В таблице — ключевые отличия:
| Характеристика | PodAgent CLI | NotebookLM | Descript AI Voices |
|---|---|---|---|
| Формат вывода | MP3/WAV + загрузка в Spotify | Только прослушивание в вебе | Экспорт в DAW |
| Контроль голосов | Выбор из 15+ вариантов, кастомные | 2 фиксированных голоса | Полный контроль, но платно |
| Музыка | Библиотека Spotify + свои треки | Нет | Только если добавить вручную |
| Сценарий | Кастомный промпт + GPT-5 | Авто, без редактирования | Вы пишете сами или через AI |
| Цена | Бесплатно (нужен Premium для публикации) | Бесплатно | От $24/мес |
Если вам нужно просто "озвучить" документ для себя — NotebookLM справится. Но для публичного подкаста с брендированием, музыкой и живыми диалогами PodAgent — первый реальный конкурент профессиональным студиям.
Кстати, о студиях: мы уже обсуждали, почему одиночка с ИИ не становится свободным творцом — с PodAgent этот тезис становится менее очевидным. Аренда студии больше не нужна, если ваш голос генерирует машина.
Публикация в Spotify: последний шаг
Сгенерированный эпизод можно сразу отправить в ваш подкаст-канал. Команда:
podagent publish --file episode1.mp3 --podcast-id YOUR_PODCAST_ID
Инструмент автоматически заполняет метаданные (название, описание, обложку) на основе вашего промпта. Если у вас ещё нет подкаста на Spotify — он создаст новый через Spotify for Podcasters. Всё, что нужно — подтвердить через браузер.
Важно: Spotify ввел правило — каждый AI-сгенерированный эпизод должен содержать дисклеймер "Created with AI". PodAgent добавляет его автоматически в описание. Это часть политики борьбы с AI-спамом, о которой мы писали в статье "Spotify объявляет войну AI-спаму".
Кому это реально нужно (и не нужно)
PodAgent — палка о двух концах. Если вы продаёте курсы и хотите быстро сделать аудиоверсию каждого урока — инструмент сэкономит недели. Если ведёте блог про космос и мечтаете о еженедельном подкасте без напряга — ideal. Но если ваша ценность = ваш голос, интонации, живое общение — бегите. Слушатели чувствуют фальшь, даже если AI идеально имитирует смех.
В прошлом материале про автономный Infinite Podcast на локальных моделях мы закладывали 10 часов на настройку. PodAgent делает то же самое за 10 минут. Вопрос: готовы ли вы пожертвовать уникальностью ради скорости?
Мой прогноз: уже к осени 2026 Spotify встроит PodAgent прямо в мобильное приложение, и создание подкастов станет таким же простым, как запись голосового сообщения. А пока — терминал, пара промптов, и ваш первый AI-подкаст готов к загрузке. Рискнёте?