ГигаЧат научился профессионально редактировать фото: до трёх картинок в одном запросе и ручная кисть

Сбер добавил в ГигаЧат новые инструменты для редактирования изображений. Теперь можно загружать до трёх фотографий для генерации и редактирования, а также вручную убирать или заменять объекты на готовых снимках без использования профессиональных программ. Обновление работает на базе флагманской модели Kandinsky 6.0 Image.
Генерация по нескольким фотографиям
Функция позволяет загрузить до трёх изображений и одним запросом собрать из них новое. Нейросеть извлекает из каждого фото нужный элемент: стиль, персонажа, фон или объект, и объединяет их в финальный результат.
Пользователь сам управляет логикой: можно один раз задать персонажа или образ и воспроизводить его в любых сценах и окружении.
Детальное редактирование: убрать или заменить объект вручную
С помощью детального редактирования можно вручную обвести кистью нужную область на изображении и указать, что с ней сделать: отредактировать, удалить объект или заменить его на другой. Инструмент позволяет достраивать изображения — добавлять недостающие фрагменты или точечно вписывать новые элементы в готовую сцену.
Ключевое преимущество — точность. Ручное выделение позволяет не описывать словами, где находится объект и каковы его границы. Результат более предсказуем и требует меньше правок.
Примеры использования:
-
убрать лишних людей с фото;
-
заменить случайно попавший в кадр предмет;
-
удалить нежелательный элемент на фоне.
Отредактированные изображения выглядят естественно, без следов изменений.
Автоподбор формата
Модель сама определяет оптимальное соотношение сторон на основе содержания запроса. Например:
-
портрет человека → вертикальный кадр;
-
панорама города → горизонтальный;
-
обложка альбома → квадрат.
Пользователь может также указать назначение изображения («пост для блога», «баннер» или «аватар»), и формат подтянется автоматически.
Кому пригодятся новые инструменты
Дизайн интерьера и архитектура: загрузить фото интерьера, образец ткани и мебель из каталога — получить готовую визуализацию; убрать лишние элементы с фото.
Мода и ретейл: собрать готовую съёмку для карточки товара из фото модели, одежды и фона; примерить товар до покупки; убрать нежелательную тень или отражение.
Брендинг и маркетинг: генерировать визуалы в едином фирменном стиле без фотосессии; обновлять баннеры точечно, меняя фон или реквизит под новый сезон.
Создание контента: один раз создать ИИ-персонажа и использовать его во всех новых сценах; переодеть героя или изменить деталь на иллюстрации, выделив именно нужный элемент.
Что говорят в Сбере
Денис Димитров, CTO Kandinsky, управляющий директор по исследованию данных Сбера:
«Мы строим ИИ-помощника, который берёт на себя рутину — освобождает время человека для того, что действительно важно. ГигаЧат должен давать уверенность, что любая задача решаема, вне зависимости от того, есть ли у человека специальные навыки или нет. Чем меньше технических барьеров стоит между идеей и результатом, тем больше людей могут реализовывать свои замыслы».
Моё мнение
Kandinsky 6.0 Image — одна из лучших нейросетей для генерации изображений на русскоязычных данных. С новыми функциями редактирования она приближается к возможностям профессиональных графических редакторов, но без сложного интерфейса.
Функция генерации по трём фотографиям — это, по сути, автоматическая сборка коллажа с интеллектуальным анализом. В дизайне интерьеров и рекламе это может сэкономить часы работы.
Детальное редактирование кистью — главное новшество. В Midjourney или DALL-E нет возможности «руками» указать, где именно нужно удалить объект. Если нейросеть не понимает текстовое описание «убери ту чашку слева», вы мучаетесь с регенерациями. Здесь вы просто рисуете область и говорите «удали». Это работает и для ретуши фотографий, и для подготовки изображений для печати.
Автоподбор формата — приятная мелочь. Когда модель сама понимает, что портрет нужно сделать вертикальным, а пейзаж — горизонтальным, это сокращает количество итераций.
Пока неясно, насколько быстро работает детальное редактирование при больших размерах изображений и насколько хорошо Kandinsky справляется со сложными текстурами (лица, волосы). Но сам факт, что Сбер внедряет такие инструменты в массовый доступ, говорит о серьёзном прогрессе.
Это уже не «игрушка для генерации котиков», а рабочий инструмент для дизайнеров, маркетологов и контент-мейкеров. Попробуйте и расскажите, насколько качественно получается.
