Kling O1 — Нано банана из мира видео
Kling O1 - это первая в мире единая мультимодальная видео-модель от китайской компании Kuaishou. Главная фишка — объединение генерации и редактирования видео в одном движке, чего раньше не было ни у одной модели
Движок 7-в-1
Kling O1 умеет выполнять семь типов задач в одной системе:
- Text-to-video и image-to-video генерация
- Создание видео по ключевым кадрам (первому/последнему фрейму)
- Добавление и удаление объектов в видео
- Стилевая трансформация (реализм → киберпанк, акварель и т.д.)
- Расширение видео (продление сцен)
- Работа с референсами (до 10 изображений для поддержания консистентности персонажей)
Chain of Thought и точность
Модель использует Chain of Thought reasoning — технологию рассуждения перед генерацией, что даёт более точное следование промтам и естественную физику движений. В отличие от Kling 1.6, где приходилось перегенерировать ролик по 5 раз, O1 с первой попытки выдаёт результат ближе к задумке.
Multi-Elements режим
Революционная фича — редактирование существующего видео через текст. Можно текстовой командой заменить предметы, добавить эффекты, убрать детали или перестилизовать весь ролик без VFX-пайплайна. Персонажи теперь реже «разваливаются» между кадрами, камера движется предсказуемее.
Технические характеристики
Модель генерирует видео длиной 3-10 секунд в разрешении 480p, 720p или 1080p с возможностью расширения до 2 минут. Встроенная технология Kling-Foley синхронизирует звук с действиями на экране — прорывная фича для создания видео со звуком. Поддерживаются форматы 16:9, 9:16 и 1:1.
Потестить можно на FAL.AI ($0.168 за секунду)