Структура промта. Часть 1
Положительный промт
Начнем с того, что хороший промт должен быть подробным и конкретным. И помни, что порядок имеет значение: нейросеть будет выставлять акценты на элементах твоего изображения в зависимости от порядка слов в промте, так что в начало рекомендую поместить самое важное.
Итак, разберем основные категории ключевых слов:
· Объект
· Стиль
· Онлайн-галереи
· Разрешение
· Дополнительные детали
· Цвет
· Осветительные приборы
Давай рассмотрим каждую категорию и создадим несколько изображений, добавив ключевые слова. Чтобы увидеть эффект только от положительного промта, поле для негативного промта мы оставим пустым. Его мы досконально изучим в следующей части и проведем сравнение для большей наглядности. Кстати, если что, без использования негативного промта внезапные три ноги или кривые руки персонажа – это нормально, так что не пугайся.
Для «чистоты» нашего эксперимента мы не будем использовать LoRa и возьмем модель Dreamshaper. Все изображения генерируются с помощью Sampling Steps – 25, CFG Scale – 7, DPM++ 2M Karas и имеют размер изображения 512×768.
ОБЪЕКТ
Объект — это то, что ты хочешь видеть на изображении. Если говорить о создании объекта, самая распространенная ошибка — описание сцены без конкретизации.
Допустим, мы хотим создать волшебницу — эльфийку, использующую магию. Новичок может написать:
elf sorceress
В итоге получится несколько достаточно приличных изображений, однако для лучшего результата стоит быть более конкретным: как ты хочешь, чтобы выглядела эльфийка? Есть ли какие-либо ключевые слова, чтобы описать ее особые черты внешности? Что она носит? Какую магию она использует? Она стоит, сидит или парит в воздухе? Какова фоновая сцена?
В качестве примера предположим, что наша эльфийка использует магию света, носит белое платье с драгоценными камнями и сидит на поваленном дереве. На заднем плане — волшебный лес.
elf sorceress, lighting magic spell, sitting on a fallen tree, detailed white dress with gemstones, magic forest background
Именно так происходит генерация детализированного объекта.
СТИЛЬ
Стиль имеет сильный эффект, поскольку одно только ключевое слово может кардинально изменить итоговое изображение.
Добавим в нашу подсказку слова fantasy, dark art и посмотрим, что из этого выйдет:
elf sorceress, lighting magic spell, sitting on a fallen tree, detailed white dress with gemstones, magic forest background, fantasy, dark art
Результаты явно отличаются: стиль помогает глубже отразить желаемое на изображении.
ОНЛАЙН-ГАЛЕРЕИ
Онлайн-галереи, такие как Artstation и Deviant Art, объединяют множество изображений разных жанров и могут послужить хорошей помощью. Их использование в промте — верный способ направить изображение в сторону этих стилей.
Давай добавим, например, Аrtstation в подсказку и посмотрим, что из этого выйдет:
elf sorceress, lighting magic spell, sitting on a fallen tree, detailed white dress with gemstones, magic forest background, fantasy, dark art, artstation
РАЗРЕШЕНИЕ
Разрешение показывает, насколько четким и детальным должно быть изображение. Так, для лучшего качества ты можешь дописать highly detailed и sharp:
elf sorceress, lighting magic spell, sitting on a fallen tree, detailed white dress with gemstones, magic forest background, fantasy, dark art, artstation, highly detailed, sharp
ДОПОЛНИТЕЛЬНЫЕ ДЕТАЛИ
Дополнительные детали — это подсластители, которые помогают внести мелкие коррективы. Итак, мы добавим dramatic и low angle shot, чтобы придать немного атмосферы, и сравним результаты.
elf sorceress, lighting magic spell, sitting on a fallen tree, detailed white dress with gemstones, magic forest background, fantasy, dark art, artstation, highly detailed, sharp, dramatic, low angle shot
ЦВЕТ
Ты также можешь управлять общим цветом изображения, добавляя ключевые слова цвета. Указанные тобой цвета могут отображаться в виде тона или же в конкретных объектах. Предлагаю для большей «волшебности» добавить изображению немного серебристого цвета с помощью ключевых слов shining silver:
elf sorceress, lighting magic spell, sitting on a fallen tree, detailed white dress with gemstones, magic forest background, fantasy, dark art, artstation, highly detailed, sharp, dramatic, low angle shot, shining silver
ОСВЕТИТЕЛЬНЫЕ ПРИБОРЫ
Любой фотограф скажет, что освещение — ключ к созданию успешных изображений, и нас это тоже касается. Так что добавим немножко backlight для усиления атмосферы «загадочности» и мистичности:
elf sorceress, lighting magic spell, sitting on a fallen tree, detailed white dress with gemstones, magic forest background, fantasy, dark art, artstation, highly detailed, sharp, dramatic, low angle shot, shining silver, backlight
На этом сегодня мы и остановимся: теперь ты знаешь все об основных механизмах работы с позитивным промтом. А разбор работы негативного промта ожидай во второй части!
Слишком поверхностно. Для новичков голых женщин погенерить если только. Нужно глубже копать. СД намного лучше работает и позволяет получать более интересные арты при использовании более сложных токенов. Например, в начале промта хорошо работает hyper-detailed professional photo (breathtaking:1.3), что сразу повышает качество и убирает надобность во всяких high details и прочем, но опять же это хорошо только для фото. Если требуется рисовка, то другой подход нужен, например связка abstract black oiled grim foggy environment with lush или что-то близкое позволит получить очень хороший эффект мрачности. Насыщенность деталями также лучше делать не через банальный detailed/intricate, а что-то поинтереснее типа great composition with intricate complexity. Много тут примеров привести можно. Ну и не надо забывать о перегрузе промта токенами. В статье начало финального промта лучше записать elf sorceress sitting on a fallen tree and cast lighting magic spell, чтобы избавиться от запятых, но длинное выражение в 1.5 (пора бы уже всем на сдхл пересесть) может плохо сработать и придется все-таки делить.
Ждём разбор негативного промта 👍
Вот негатив и разбирать ничего не надо:
(Low_quality:1.5), blurry, ugly, duplicate, error, fake, watermark, text, monochrome
Для всяких мутантов-пришельцев убираем угли, дупликейт, еррор и фейк. Для чб и одноцветок убираем монохром.