МузАИ МузАИ
МК
Максим Касаткин · Основатель МузАИ ·

Удаление вокала нейросетью: инструментал из любой песни

Раньше, чтобы получить минусовку, нужно было искать её на форумах, заказывать у аранжировщика или мириться с «каверами без вокала» на YouTube. Сейчас нейросеть Demucs от Meta разделяет любой трек на вокал и инструментал за минуту — с качеством, которое ещё пять лет назад казалось невозможным. Разбираем, как это работает и зачем нужно.

Как Demucs разделяет музыку

Demucs (Deep Extractor for Music Sources) — open-source модель от Meta AI Research. Последняя версия — htdemucs_ft — использует гибридную архитектуру: Transformer работает в частотной области (спектрограмма), а свёрточная сеть — во временной (waveform). Результаты двух веток объединяются.

Что значит «сепарация»

Финальный микс песни — это сумма всех инструментов. Demucs решает обратную задачу: из суммы восстанавливает слагаемые. Модель обучена на датасете MUSDB18 — 150 треков с изолированными дорожками (вокал, барабаны, бас, остальное).

2-track (4 ⚡)

  • Вокал (голос, бэк-вокал)
  • Инструментал (всё остальное)

3-track (10 ⚡)

  • Вокал
  • Барабаны и перкуссия
  • Остальные инструменты

Зачем удалять вокал: 6 сценариев

Караоке

Любая песня превращается в караоке-трек. Не нужно искать «минус» — загрузите оригинал, получите инструментал. Качество лучше, чем у большинства караоке-сервисов.

DJ и ремиксы

3-track сепарация даёт изолированные барабаны — идеально для битмейкинга. Вытащите вокал из одного трека, наложите на бит другого — и у вас mashup за 5 минут.

Бэк-треки для выступлений

Вокалисты и музыканты используют минусовки для репетиций и живых выступлений. Demucs даёт чистый инструментал без «призрачного» вокала на фоне.

Обучение музыке

Выделите партию барабанов, чтобы разобрать ритм-паттерн. Или уберите вокал, чтобы разучить аккорды под «живой» аккомпанемент.

Видеоконтент

Нужен фоновый инструментал для ролика? Удалите вокал из любимого трека. Для YouTube рекомендуем создать оригинальную музыку нейросетью — без рисков с авторским правом.

Сэмплирование

Продюсеры вытаскивают из старых записей отдельные элементы: вокальные фразы, драм-луп, гитарный рифф. Demucs делает то, для чего раньше нужна была студия.

МузАИ vs другие сервисы

Сервис Модель Бесплатно 3-track
МузАИ Demucs v4 (htdemucs_ft) 5 треков (20 ⚡) да
Vocali.se Demucs v3 1 трек/день нет
LALAL.AI Своя (Cassiopeia) 10 мин (preview) да (платно)
Moises Своя 5 треков/мес да

Преимущество МузАИ — не только сепарация. Вы можете тут же создать новый трек из выделенного вокала, наложить его на другую мелодию или использовать в видеоклипе. Всё в одной экосистеме.

Как удалить вокал в МузАИ

1. Загрузите трек

Откройте приложение и выберите «Удаление вокала». Загрузите MP3, WAV или другой аудиофайл (до 10 минут).

2. Выберите режим

2-track (4 ⚡) — вокал + инструментал. 3-track (10 ⚡) — вокал + барабаны + остальное. Для караоке достаточно 2-track.

3. Подождите обработку

Demucs обрабатывает трек за 30-90 секунд в зависимости от длины. Результат — отдельные аудиофайлы для каждой дорожки.

4. Скачайте результат

Каждая дорожка доступна для скачивания. Формат — MP3. Файлы сохраняются в вашей библиотеке.

Технические нюансы

  • 1. Качество входа = качество выхода. 128 kbps MP3 даст худший результат, чем 320 kbps или FLAC. Загружайте лучшее, что есть.
  • 2. Реверберация — враг сепарации. Треки с сильным эхо/реверберацией разделяются хуже. «Сухой» микс — идеальный кандидат.
  • 3. Стерео лучше моно. Demucs использует разницу между каналами для локализации источников. Стерео-трек даёт более чистый результат.
  • 4. Живые записи сложнее. Студийный микс разделяется чище, чем запись концерта с одного микрофона — потому что инструменты лучше изолированы в стерео-поле.

Удалите вокал из любой песни

2-track — 4 ⚡, 3-track — 10 ⚡. Первые 20 ⚡ бесплатно.

FAQ

Частые вопросы

Какое качество разделения у Demucs?
Demucs v4 (htdemucs_ft) — лучшая открытая модель для сепарации на 2024-2026. SDR (Signal-to-Distortion Ratio) вокала — около 9.0 dB. На практике: вокал чистый, лёгкие артефакты могут быть на сложных миксах с реверберацией.
В чём разница между 2-track и 3-track?
2-track разделяет на вокал + инструментал (4 ⚡). 3-track разделяет на вокал + барабаны + остальные инструменты (10 ⚡). 3-track полезен для DJ и продюсеров, которые хотят работать с отдельными стемами.
Какие форматы файлов поддерживаются?
MP3, WAV, OGG, FLAC, M4A. Максимальная длина трека — 10 минут. Рекомендуем загружать файлы в хорошем качестве (от 192 kbps) — чем лучше исходник, тем чище результат.
Можно ли удалить вокал бесплатно?
При регистрации в МузАИ вы получаете 20 ⚡. Удаление вокала (2-track) стоит 4 ⚡ — хватит на 5 треков. Бесплатные альтернативы (vocali.se, lalal.ai) имеют ограничения по длине и качеству.