Stable Diffusion - Генерируем Картинки В Домашних Условиях

Что такое Stable Diffussion? Stable Diffusion — это бесплатная альтернатива Midjourney с открытым исходным кодом, которая позволяет создавать изображения на основе текстовых описаний.

Он был выпущен в 2022 году и разработан группой CompVis из Мюнхенского университета в сотрудничестве с Runway, EleutherAI и LAION.

Stable Diffusion представляет собой инновационный подход к созданию изображений с использованием текстовых данных для создания высококачественного визуального контента.

Он предлагает пользователям возможность преобразовывать текстовые описания в уникальные и увлекательные изображения.

Примеры сгенерированных мною картин на Stable Diffusion на своем ноутбуке Еще красивых картинок, генерированных stable diffusion и deliberate Кому это нужно? Всем, кому нужны уникальные картинки для контента.

Их можно использовать для автоматического наполнения своих сайтов, групп и пабликов в социальных сетях, для наполнения товарами интернет магазинов и т.д. Применение широкое.

Что мы будем делать в рамках статьи? Мы установим у себя на домашнем ПК / Ноуте Stable Diffusion и будем генерировать картинки через наш любимый Zennoposter ) Требования Для того, чтобы поднять Stable Diffusion у себя на ПК по данному примеру, у вас должна быть Видеокарта Nvidia хотя бы с 4гб оперативной памятью.

Характеристики Ноутбука на котором поднимался StableDiffusion в данном эксперименте

Stable Diffusion - Генерируем Картинки В Домашних Условиях

Качаем Stable Difussion с WebUI и обученные модели Stable Diffusion с WebUI - Официальный можно скачать отсюда -> GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI Модели Stable Diffusion - Качаем отсюда CompVis/stable-diffusion-v-1-4-original · Hugging Face Дообученная модель для более качественной генерации лиц - stabilityai/sd-vae-ft-mse-original · Hugging Face * Я в данном эксперименте взял vae-ft-mse-840000-ema-pruned.ckpt так как характеристики ноута позволяют, если у вас характеристики поменьше, можете взять более слабые версии Дообученные обычными пользователями модели можно взять отсюда: https://civitai.com/ Для данного эксперимента я скачал несколько дообученных моделей

Stable Diffusion - Генерируем Картинки В Домашних Условиях

ИМХО из них лучший Deliberate https://civitai.com/models/4823/deliberate , на нем и сгенерированы картинки выше в примерах.

После того как скачали модели, их всех кидаем в папку models/Stable-diffusion Следующее, что нам нужно сделать - чутка подкорректировать файл webui-user.bat для лучшей генерации лиц.

Для этого открываем файл в любом текстовом редакторе, например Notepad++ Вот содержимое файла у меня: Код:

 

 @echo off

set PYTHON=

set GIT=

set VENV_DIR=

set COMMANDLINE_ARGS= --api --xformers --vae-path "models\Stable-diffusion\vae-ft-mse-840000-ema-pruned.ckpt"

call webui.bat

Сохраняем и закрываем.

Все, теперь можно запустить у нас Stable Diffusion. Для этого запускаем webui-user.bat У вас должна открыться консоль и там вы увидите нечто такое:

Stable Diffusion - Генерируем Картинки В Домашних Условиях

Это значит, что у нас webui запущен и можно поэкспериментировать с моделями, генерировать картинки.

Для этого в браузере переходим: http://127.0.0.1:7860/ Перед вами откроется веб интерфейс:

Stable Diffusion - Генерируем Картинки В Домашних Условиях

Заключение Это просто был эксперимент. Мне на данный момент генерация изображений не очень то и нужно )) Но скоро понадобиться.

Точно также можно на домашнем ПК поднять аналоги Chat GPT. Я уже пробовал на CPU запустить языковую модель Alpasta. Работает конечно очень медленно на cpu, долго генерирует, на GPU еще не запускал, но на следующем конкурсе возможно напишу статью и про него ))

В чем преимущество локального поднятия? Это генерация контента БЕСПЛАТНО и БЕЗ ограничений.

Если учитывать, что картинки размером 500x500 генерируются примерно за 3-4 секунды, то в сутки можно будет генерировать примерно 20-30к картинок для контента.

А это неплохой результат. Также SD и шаблон можно использовать для автогенерации видео через ffmpeg например.

Где визуальную часть будет генерировать SD. На этом все :) Удачных экспериментов!