Майские праздники 2024: как отдыхаем и работаем?

Теперь все мы в исскустве

Видно, как нейросеть Kandinsky умнеет: сравните сами три версии: 2.0, 2.1 и 2.2. Теперь все мы в исскустве “Цифра” для каждого нейросети Искусственный интеллект

Видно, как нейросеть Kandinsky умнеет: сравните сами три версии: 2.0, 2.1 и 2.2.

Приятным нововведением в Kandinsky 2.2 стала возможность генерировать стикеры. Например, таких котиков. Картинка создана Kandinsky 2.2.Теперь все мы в исскустве “Цифра” для каждого нейросети Искусственный интеллект

Приятным нововведением в Kandinsky 2.2 стала возможность генерировать стикеры. Например, таких котиков. Картинка создана Kandinsky 2.2.

Александр ВЕДЯХИН, первый заместитель председателя Правления СбербанкаТеперь все мы в исскустве “Цифра” для каждого нейросети Искусственный интеллект

Александр ВЕДЯХИН, первый заместитель председателя Правления Сбербанка


0

2023-й можно смело назвать годом бурного развития генеративного искусственного интеллекта. Это касается не только привычной нам модальности изображений (Kandinsky 2.1, Stable Diffusion XL, IF, Шедеврум и другие), но и текстовой (ChatGPT, GPT-4, LLaMA, Falcon, GigaChat и др.), аудио (VALL-E, MusicLM и др.), 3D (Magic3D и др.) и даже модальности видео (Gen-2, CogVideo и другие). При этом ни в одном из направлений выделить объективного лидера почти невозможно: все команды стараются равномерно двигаться вперед и повышать качество синтеза.


Нейросети умнеют
Текстовые чат‑боты научились взаимодействовать с внешними системами посредством плагинов, синтез изображений вышел на уровень фотореалистичных генераций, длина видео постепенно увеличивается с сохранением сюжетной связности между кадрами. И такой прогресс обусловлен уже не только наращиванием вычислительных мощностей, но и большим числом неординарных архитектурных решений, которые позволяют добиваться лучшего качества.
Некоторые наши читатели, даже старшего поколения, рассказали, что уже вовсю пользуются нейросетями. В частности, отмечают продукт Сбера Kandinsky. Разработчики, вдохновленные картинами русского художника Василия Кандинского, стоявшего у истоков абстракционизма, назвали самую большую на данный момент генеративную модель именем великого мастера.

Александр ВЕДЯХИН, первый заместитель председателя Правления Сбербанка:
— Мы продолжаем совершенствовать нашу нейросеть для создания уникального контента. Новая версия дает пользователям еще больше возможностей, при этом она генерирует изображения в еще лучшем качестве. Нейросеть уже не просто пытается подражать творчеству человека, а способна создавать новые художественные смыслы и интерпретации. Как и предыдущая версия, Kandinsky 2.2 находится в открытом доступе, так что протестировать ее можно совершенно бесплатно.

Что за Kandinsky
Совсем недавно, в июле, вышла свежая версия Kandinsky 2.2 — теперь можно создавать фотореалистичные изображения с более высоким разрешением и изменять соотношение сторон при генерации. Значительного прироста качества удалось достигнуть при создании портретов. Для дообучения нейросети использовался датасет (набор данных, которые используются в различных видах анализа и машинного обучения) в размере 1,5 млрд пар “текст — изображение”. Это на 300 миллионов больше, чем в предыдущей версии — Kandinsky 2.1.
Новая версия модели научилась генерировать стикеры, из которых можно собирать полноценные стикерпаки в Telegram. Также бот Kandinsky 2.2 теперь способен изменять по текстовому описанию отдельные объекты или элементы на изображениях, сохраняя композицию исходной иллюстрации. Это стало возможным благодаря внедрению в модель специального структурного блока управляемых изменений — ControlNet.
Kandinsky 2.2 понимает запросы на русском и английском языках, умеет рисовать более чем в 20 стилях, смешивать несколько рисунков, стилизовать изображение по текстовому описанию, генерировать изображения, похожие на заданные, дорисовывать недостающие части картинки (inpainting), создавать картины в режиме бесконечного полотна (outpainting).

Где опробовать
Оценить возможности нейросети можно бесплатно на промостранице модели на сайте Сбера, платформе FusionBrain.AI, в Telegram-боте @kandinsky21_bot и одноименном боте в соцсети “ВКонтакте”, а также при помощи команды “Запусти художника” на умных устройствах Sber, в мобильном приложении “Салют”. Модель доступна на платформе ML Space в хабе предобученных моделей и датасетов DataHub.
Нейросеть разработали и обучили исследователи Sber AI при партнерской поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices. Напомним, что предыдущая модель — Kandinsky 2.1 — стала самой быстрорастущей нейросетью в мире, набрав один миллион пользователей всего за четыре дня после выхода.

  • Видно, как нейросеть Kandinsky умнеет: сравните сами три версии: 2.0, 2.1 и 2.2.
  • Приятным нововведением в Kandinsky 2.2 стала возможность генерировать стикеры. Например, таких котиков. Картинка создана Kandinsky 2.2.
  • Александр ВЕДЯХИН, первый заместитель председателя Правления Сбербанка