Как установить и пользоваться Stable Diffusion к себе на ПК(БЕСПЛАТНО)
В современное время нейросети уже не вызывают удивления, поскольку они способны создавать практически любые изображения, часто неотличимые от обычных фотографий. Однако большинство подобных онлайн-сервисов либо требуют оплаты, либо имеют серьезные ограничения, которые мешают полноценному использованию. Примером такого сервиса является Midjourney, который недавно перестал быть доступным бесплатно.
Однако представьте себе, что существует полностью бесплатная нейросеть с открытым исходным кодом, которую можно установить на свой персональный компьютер. Это кажется фантастикой? Нет, на самом деле такая нейросеть уже существует, и ее название - Stable Diffusion. К тому же, изображения, создаваемые этой нейросетью, во многом не уступают тем, которые можно получить с помощью Midjourney. Важно отметить, что в Stable Diffusion отсутствует цензура, а если она и присутствует, то легко и просто отключается, предоставляя свободу для творчества.
Что такое Stable Diffusion?
Это программа с открытым исходным кодом, которая разрабатывается сообществом Stability.Ai и состоит из двух основных компонентов: обученной нейросети (модели) и интерфейсной части, предназначенной для взаимодействия с ней. Кроме того, имеются несколько вариантов интерфейса для использования Stable Diffusion.
Первый способ - использование консоли. Этот метод предназначен для продвинутых пользователей, однако может быть достаточно сложным для обычного пользователя. Зато он обеспечивает высокую гибкость настройки и работы с Stable Diffusion.
Второй способ - веб-интерфейс. Он функционирует через браузер, не требует установки и может использоваться на любых устройствах. Однако в этом случае следует учесть, что скорость работы сервиса может быть немного медленнее, а некоторые возможности могут быть ограничены.
Третий способ - графический интерфейс. В действительности, это именно то, о чем говорилось выше. Этот метод предполагает установку нейросети на ваш компьютер и взаимодействие с ней через графическую оболочку программы.
Требования к системе
Требования к системе для работы Stable Diffusion оказались удивительно доступными. Фактически, все, что вам нужно, это компьютер с операционной системой Windows 10 или 11, обладающий 8 ГБ оперативной памяти (или более), видеокартой Nvidia 10xx (или более новой), которая имеет не менее 4 ГБ видеопамяти, и 20 ГБ свободного дискового пространства.
Он также будет работать на компьютерах с Linux и на устройствах Mac с процессорами M1 или M2. Если у вас нет совместимой видеокарты, в настройках программы можно выбрать использование процессора (Use CPU), но стоит иметь в виду, что в этом случае генерация изображений будет происходить значительно медленнее.
Установка нейросети
- Скачать нейросеть на ПК можно по этой ссылке и распакуйте ее в корневую директорию любого накопителя.
- В появившейся на диске папке stable-diffusion-ui запустите файл Start Stable Diffusion UI.cmd и дождитесь завершения загрузки и установки дополнительных компонентов.
- После завершения установки вас перенаправит в браузер с запущенным интерфейсом Stable Diffusion. Но на этом процесс установки не заканчивается.
- Все дело в том, что сейчас мы установили лишь графическую оболочку программы, а для генерации изображений ей потребуется еще и обученная нейросеть или, если сказать иначе, модель.
Модель можно скачать на одном из множества ресурсов в сети. Например, здесь. Но учтите, что большинство из них узкоспециализированные — одни из них умеют рисовать роботов, другие предназначены для генерации изображений в стиле аниме, третьи — пейзажей, четвертые — людей и т.д. Лучшей же для генерации изображения людей считается модель Deliberate 2.0. Ее можно скачать здесь. После этого:
- перенесите скачанную модель в папку stable-diffusion-ui\models\stable-diffusion и перезагрузите нейросеть.
- откройте настройки Stable Diffusion и выберите нужную модель в выпадающем списке меню Model.
Генерация изображений
Как и в случае с Midjourney, для генерации изображений с помощью Stable Diffusion достаточно набрать его текстовое описание на английском языке. Но кое-какие нюансы здесь все-таки есть. И в первую очередь они касаются настроек в графическом интерфейсе программы.
Укажите в настройках требуемое разрешение изображения. Оптимальным здесь считается 512х512 пикселей, тогда как более высокое разрешение приведет к тому, что ваша видеокарта будет работать на пределе своих возможностей. Поэтому мы советуем устанавливать разрешение 512х512 пикселей и при необходимости увеличивать его с помощью любых сервисов апскейлинга в сети.
Укажите количество шагов для генерации изображения. Чем больше их число, тем более качественным окажется итоговое изображение, но и тем больше времени понадобится на его создание. Здесь мы рекомендуем устанавливать значение в 50 или меньше «прогонов».
Задайте степень свободы ИИ. За это отвечает параметр Creativeness. Чем он выше, тем менее свободно нейросеть будет интерпретировать текстовое описание изображения, «додумывать» недостающие элементы и т.д. По умолчанию рекомендуется устанавливать этот параметр на 8.
Если же говорить о правилах создания текстового описания изображения, то они мало отличаются от таковых у Midjourney. Оно также должно быть максимально полным. Но учтите, что воспринимаются ею только первые 75 слов описания. Для высокого качества изображения достаточно указать в нем слова вроде high quality и 4k, а вес слов зависит от их расположения: чем ближе слово к началу описания, тем более важным оно будет считаться.
Впрочем, установить вес слова или фразы можно и привычным способом. Достаточно набрать после него знак двоеточия и указать числовое значение веса. Просто учтите, что все слова или фразы в описании должны иметь общий вес 100. К примеру, подобное изображение вы получите, если используете такую двойную фразу: «a small cute blue dragon perched on a footstool, photography, Canon EOS, color, cinematic postprocessing:55 a cute brown ferret perched on a footstool, photography, Canon EOS, color, cinematic postprocessing:45». Вес первой ее части равен 55, а второй — 45.
Есть у Stable Diffusion и еще одна интересная функция. Вы можете загрузить в нейросеть собственное изображение и попросить ее сгенерировать похожую картинку. А то насколько она окажется похожа на оригинал, зависит от веса начального изображения, который вы укажете.
Итоги
Stable Diffusion — это отличная альтернатива нашумевшей Midjourney. В отличие от последней, она полностью бесплатна и может работать на вашем компьютере без какой-либо цензуры. Правда, и процесс настройки программы немного сложнее, а результаты ее работы сильно зависят от выбранной вами модели.
Не забудь подписаться на канал. Там много про нейросети и разные полезные сервисы