Иветта: работа с жестами, эмоциями и мимикой
История этой ИИ фотомодели началась примерно 1,5 года назад. Тогда, в нейросети Stable Diffusion, на основе живой фотографии леса в закате, сочетания цвета и света, мне удалось создать изображение этой молодой женщины, фотографического качества. Нейросети стремительно развиваются. Вот настал момент, когда уже можно во вполне приемлемом качестве, ЛОКАЛЬНО, мастерить собственное видео в режиме I2V.
В открытом, бесплатном доступе, вышел великолепный инструмент под названием Framepack.
Не сильно требовательный к ресурсам ПК. В процессе работы, обратил внимание, что основной упор идёт на накопитель, ОЗУ и видеокарту. Мне вполне хватило обычного жесткого диска, 64Гб ОЗУ и RTX3090. Но лучше SSD m.2, 128Гб ОЗУ и RTX последних серий. Генерация происходит в 2 этапа. Первый, работает "Encoder" - вся нагрузка на накопитель (100%). Второй "Sampling" - вся нагрузка на ОЗУ и видеокарту. Эта нейросеть довольно хорошо следует командам. Порядка 70% процентов команд исполнила в точности. Конечно есть проблемы с качеством изображения, но всё впереди, я думаю.
Одно из направлений, к чему идёт всё происходящее по части видеогенерации - будут появляться нейро актёры и актрисы. Будут нейро художественные фильмы и сериалы. Своя актриса у меня уже есть - Иветта Болсер (Yvette Bolser).
Если переложить это на коммерческую составляющую, представляете, насколько это экономически целесообразно! Подумайте сами, каких требует ресурсов провести живую съемку - найти красотку, выезд в локацию, съемки, время, финансы...
Конечно путей может быть огромное множество. В частности, можно провести настоящую съемку, а благодаря AI инструментам получить более сложные, гибридные, если можно так выразиться, шедевры.
Когда-то давно в 90-х, я видел репортаж о советском боевом космолёте конструкции Глеба Лозино-Лозинского "Спираль". Суть в следующем. Это был своеобразный аппарат со своими огромными преимуществами. Но политическое руководство страны закрыло проект в пользу иностранного "Шатла". Точнее его аналога - "Буран". Конечно, великие умы реализовали его несколько иным. Со своими преимуществами над "Шатлом". Однако, в итоге "Буран" - это музейный экспонат, никому не нужный, не приносящий пользу. И таких историй - не одна. Если вспомнить "ЭВМ"... Так вот. Именно тогда, для себя лично, я сделал вывод, которого придерживаюсь всю жизнь - "делай своё, развивай своё, не надо пытаться подражать кому-то, старайся сделать уникальное, собственное". И вот сейчас, на своём пути медийной разработки с применением AI, я вижу бесчисленное количество положительных результатов, созданных с почти полным отсутствием усилий, благодаря платным сервисам. Конечно нельзя судить абсолютно. В каких-то направлениях, которые не считаю для себя приоритетными, я так же задействую сервисы. Но вот по части фото и видео изображения, я в поисках своего пути. Делаю локально. Кто не знает, локально не так просто получить высокое качество изображений в тех положениях, которые желаешь. И база знаний тоже должна быть, а она естественно основывается на результатах чужих трудов. К этим фото реалистичным изображениям, сегодня я пришёл своим путём. Определённые визуальные тонкости, были получены своеобразным техническим путём (не "КонтролНет"). И это вызывает у меня личный восторг. Но если трезво посмотреть, сейчас это просто хобби. Многое ещё предстоит изучать. До профессионализма в этом направлении ещё далеко.