Модель BS Roformer. На данный момент модель даёт самое высокое качество разделения на вокальную и инструментальную дорожки (за исключением ансамблей). Метрики лучше чем у предыдущего лидера - MDX23C. Это модифицированная версия исходной модели BS Roformer. Изменения были сделаны lucidrains на github. Вторая версия весов для модели с лучшим качеством была подготовлена viperx. Последние версии моделей это улучшенные версия весов viperx. Они тренировались на гораздо большем датасете. И имеют лучшие метрики на трех различных проверерочных системах.
Таблица качества
Algorithm name | Multisong dataset | Synth dataset | MDX23 Leaderboard |
||
SDR Vocals | SDR Instrumental | SDR Vocals | SDR Instrumental | SDR Vocals | |
BS Roformer (ver. 2024.02) | 10.42 | 16.73 | 12.45 | 12.16 | --- |
BS Roformer (viperx edition) | 10.87 | 17.17 | 12.71 | 12.41 | 11.751 |
BS Roformer (ver. 2024.04) | 11.24 | 17.55 | 13.47 | 13.17 | 11.915 |
BS Roformer (ver. 2024.08) | 11.31 | 17.62 | 13.56 | 13.27 | --- |
unwa high instrum fullness | 10.94 | 17.25 | 13.23 | 12.94 | --- |
BS Roformer (ver. 2025.07) | 11.89 | 18.20 | 14.58 | 14.28 |
Детальная статистика на Multisong датасете:
Model | Vocals fullness | Vocals bleedless | Vocals SDR | Vocals L1Freq | Instrum fullness | Instrum bleedless | Instrum SDR | Instrum L1Freq |
unwa high instrum fullness | 15.85 | 24.29 | 10.94 | 36.92 | 34.72 | 40.43 | 17.25 | 39.50 |
BS Roformer (ver. 2025.07) | 17.23 | 38.24 | 11.89 | 40.03 | 27.82 | 49.12 | 18.20 | 40.99 |