Модель состоит из двух частей: пространственного автокодировщика и основы для скрытой диффузии. Обе части основаны на трансформерах: автокодировщик — на ViT, а основа — на DiT. В отличие от недавних моделей мира, зависящих от действий, таких как GameNGen и DIAMOND, были выбраны трансформеры, чтобы обеспечить стабильное, предсказуемое масштабирование и быстрый вывод на ASIC-трансформерах Etched, Sohu.
Судя по видосикам будущее за наркотиками.
Тем не менее это всё ооооочень похоже и на всякие сны под температурой. На работу мозга в свободном его полёте
Абсолютно бессмысленная вещь.
Для того что бы научить такую нейросеть... нужен :
А) майнкрафт
Б)миллиарды часов видеоконтента по нему.
И как итог мы получа глюки аля сон, в которых ожна сущность легко перетякает в другую, так как нейросеть характеристики не запоминает , и в ней нет внутри данных кроме данных прошлого скиншота.
прогресс неизбежно приводит к чему-то великому.
это - один шаг на пути прогресса.
без таких, даже небольших шажков прогресс невозможен.
Эта работа - исследование, расширение границ возможного. Паровой двигатель тоже появился не сразу, этому предшествовало куча бессмысленных, на первый взгляд, экспериментов и изобретений.
и в ней нет внутри данных кроме данных прошлого скиншота.а вот это заявление тянет на обсер
Ну вот в этом и корень нынешней проблемы, что модель не может помнить данные в долгосроке. Если брать под условия генерацию биомов, управление и тд, то на данный момент с чипом h100s она справляется не плохо.