Модель BandIt Plus для разделения треков на голос, музыку и эффекты. Она может быть полезна для телевизионных или кинематографических роликов. Модель была выложена авторами статьи "A Generalized Bandsplit Neural Network for Cinematic Audio Source Separation" в репозитории на GitHub. Модель была натренирована на наборе данных Divide and Remaster (DnR). И на данный момент имеет лучшие метрики качества среди подобных моделей.
Таблица качества
Название алгоритма | DnR dataset |
||
SDR Speech | SDR Music | SDR Effects | |
BandIt Plus | 15.62 | 9.21 | 9.69 |