1) Мы сделали релиз новой модели высокого качества BS Roformer v2. Это архитектура на базе трансформеров от команды ByteDance. Метрики качества немного превосходят метрики MDX23C. Модель продолжает улучшаться, так что ожидайте новые релизы в ближашее время. Демо можно посмотреть здесь.
2) Все ансамбли были обновлены с учетом BS Roformer v2. Старая версия ансамблей так же осталась доступна. SDR метрики ансамблей выросли: Vocals SDR: 10.44 -> 10.75 Instrumental SDR: 16.74 -> 17.06
3) Мы добавили возможность скачивать архив файлов полученных после разделения.
4) Была добавлена модель высокого качества Whisper (версии large-v3) от компании OpenAI, которая позволяет получать текстовую транскрипцию текста песни/диалога из произвольного аудио.