1) Мы добавили новую модель BandIt Plus для разделения треков на голос, музыку и эффекты. Она может быть полезна для телевизионных или кинематографических роликов. Модель была выложена авторами статьи "A Generalized Bandsplit Neural Network for Cinematic Audio Source Separation" в репозитории на GitHub. Модель была натренирована на наборе данных Divide and Remaster (DnR). И на данный момент имеет лучшие метрики качества среди подобных моделей. Демо работы алгоритма можно посмотреть здесь.
Таблица качества
Название алгоритма | DnR dataset |
||
SDR Speech | SDR Music | SDR Effects | |
BandIt Plus | 15.62 | 9.21 | 9.69 |
2) Код почти для всех моделей был обновлен таким образом, что качество разделения немного выросло, а скорость разделения увеличилась.
3) Модель для удаления звуков толпы (Crowd removal) была обновлена. Добавлено более качественное удаление смеха.