Крупнейший российский банк «Сбер» сделал шаг в сторону демократизации ИИ-технологий, выложив в открытый доступ две модели: Giga-Embeddings для векторного представления текста и Kandinsky Video Lite для генерации видео. Эти инструменты, основанные на разработках Sber AI, распространяются под Apache 2.0-лицензией, позволяющей свободное использование в коммерческих проектах без ограничений.

Источник «Сбер»

Giga-Embeddings, построенная на базе языковой модели GigaChat-3B, использует трехэтапный процесс обучения: предобучение, тонкую настройку и мультизадачную доработку. Модель генерирует эмбеддинги размерностью 2048, применяя метод Latent-Attention для пулинга. Это делает ее эффективной для задач семантического поиска, кластеризации и рекомендаций, превосходя аналоги по обработке русскоязычных данных. Доступна на Hugging Face для интеграции в API GigaChat.

Kandinsky Video Lite — легковесная модель с 2 млрд параметров, лидирующая среди открытых аналогов по бенчмарку EvalCrafter. Она создает реалистичные видео длительностью до 10 секунд в разрешении 480p на основе текстового описания, опираясь на архитектуру FusionFrames и диффузионные сети Kandinsky 3.0. Разгон на GPU занимает минуты, что идеально для контент-креаторов и маркетинга. Модель доступна на GitHub ai-forever для скачивания и доработки.