Что сразу хочу сказать, модель мультимодальная, можно загрузить изображение и попросить описать, что там происходит, можно загрузить скрин и попросить написать текст оттуда, можно загрузить pdf и попросить сделать саммари, можно сгенерировать изображение благодаря модели Aurora - про нее отдельно ниже.