Нейро-дайджест: ключевые события мира AI за 4 неделю сентября 2025
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.
Неделя выдалась насыщенной: xAI выкатила дешёвый и быстрый Grok 4 Fast, новые релизы от Alibaba и Luma. Figma и Google Chrome теперь с нейросетями, Meta* представила очки с ИИ-фильтром, а хакеры в Корее вовсю используют ИИ.
Всё самое важное — в одном месте. Поехали!
P. S. Этот выпуск необычный — я добавил видеоверсию дайджеста на 7 минут в конце поста, на случай, если вам лень читать.
📋 В этом выпуске:
🧠 Модели и LLM
- Grok 4 Fast — дешёвый и быстрый
- DeepResearch от китайцев на уровне OpenAI
🎨 Генеративные нейросети
- Wan 2.2 Animate — дипфейки на максималках
- ComfyUI в облаке
- Reve — ещё один конкурент NanoBanana
- Luma Labs Ray 3 — думающий генератор видео
🔧 AI-инструменты и платформы
- Figma теперь с ИИ
- В Google Chrome встроили Gemini
- Gamma 3.0 — обновление ИИ для презентаций
🧩 AI в обществе и исследованиях
- ИИ смог бы обзвонить всю планету за 6 суток
- AI очки от Meta*
- Хакеры из КНДР начали использовать ИИ-картинки для атак
🧠 Модели и LLM
❯ Grok 4 Fast — дешёвый и быстрый
xAI представила модель Grok 4 Fast — гибридную модель с 2 млн токенов контекста и скоростью 300 токенов в секунду.
Цены приятные: $0.2/$0.5 за 1М токенов при контексте до 128k и $0.4/$1 за 1М токенов, если контекст длиннее.
И это в 50 раз дешевле Grok 4.
Две недели модель прятали под названиями Sonoma Sky/Dusk на OpenRouter.
По другим тестам:
— в 4 раза дешевле DeepSeek V3.1
— в 6 раз дешевле Gemini 2.5 Flash
— reasoning Grok 4 Fast в 2 раза дешевле GPT-OSS 120B и Grok 3 Mini.
Сейчас модель доступна бесплатно на OpenRouter.
❯ Tongyi DeepResearch — открытая модель для ресёрча
Alibaba представила Tongyi DeepResearch — первую открытую модель, которая по качеству догнала оригинальный Deep Research от OpenAI.
Она создана для глубокого сбора фактов из интернета: на вход поступает вопрос, а модель сама планирует шаги, ищет информацию в источниках, синтезирует промежуточные данные и выдает финальный отчет.
По бенчмаркам:
- В обычном режиме модель выдаёт 32.9 балла на бенчмарке Humanity's Last Exam.
- Существует Heavy Mode, в котором несколько агентов вместе работают над одним отчётом. С ним результаты на том же бенчмарке вырастают до 38.3.
Модель основана на Qwen 30B-A3B, поэтому её запуск на локальных машинах не должен быть проблемой. Код и веса уже выложены в открытый доступ.
🔗 Официальный релиз Alibaba 🔗 Код 🔗 Веса
🎨 Генеративные нейросети
❯ Wan 2.2 Animate — дипфейки на максималках
Alibaba представила Wan 2.2 Animate — новую открытую модель, которая умеет переносить движения из видео на персонажа и заменять его в кадре. Для анимации достаточно загрузить изображение персонажа и эталонное видео — модель повторит все движения и мимику источника.
Работает в двух режимах:
- Animation Mode — переносит движения из референсного видео на статичного персонажа.
- Replacement Mode — полностью заменяет персонажа в оригинальном ролике, автоматически подстраиваясь под освещение и окружение.
Модель имеет 14 млрд активных параметров (27 млрд — общих, благодаря MoE-архитектуре) и генерирует видео в качестве до 720p при 24fps.
Она точно копирует мимику, движения пальцев и работает с любыми персонажами, от реальных людей до аниме.
Для генерации видео требуется мощное железо: на A100 80GB процесс занимает около 3 минут, но с оптимизациями модель можно запустить и на RTX 4090.
❯ ComfyUI теперь в облаке
ComfyUI запустили облачную платформу для генерации контента прямо в браузере. Теперь не нужно ничего скачивать и обновлять — всё работает на любом устройстве.
Принцип простой: вы собираете нужные узлы (пайплайны) в визуальном редакторе, а система сама обрабатывает схему и выдаёт результат без необходимости писать код.
Например, можно собрать цепочку: узел «Промпт» → Модель для генерации изображений → Сохранение.
Обещают бесплатный доступ, но пока платформа работает в режиме закрытого тестирования.
❯ Reve — ещё один конкурент NanoBanana
Вышел Reve — новый ИИ-редактор изображений с щедрыми лимитами. Его генеративная модель ещё в марте заняла первое место на арене, обогнав Midjourney и Google Imagine.
Ключевые фичи:
- Генерирует 4 варианта картинки и сам объясняет текстом, что именно поменял.
- Drag-and-drop редактор, в котором можно двигать объекты по сцене, как в Photoshop.
- Вместо сложных промптов для правок используется чат-ассистент.
- Есть функция Edit, которая раскладывает картинку на составные части для удобного редактирования.
- Доступен API для интеграции в другие сервисы.
Цензура в редакторе почти отсутствует, а кредиты для генерации выдают ежедневно. Если вам нравятся NanoBanana и SeeDream, Reve точно стоит попробовать.
❯ Luma Labs Ray 3 — думающий генератор видео
Luma Labs выпустила новую видеомодель Ray 3, которая генерирует ролики длиной 5 или 9 секунд в качестве 1080p 16-bit HDR.
Реальные результаты пользователей пока далеки от официальных примеров. Лица и детализация плывут.
Как работает:
- Сначала LLM-модель переписывает и детализирует ваш промпт.
- При генерации 9-секундного видео сначала создаётся 5-секундный фрагмент, который затем расширяется ещё на 5 секунд с перехлёстом в одну секунду. Это говорит о том, что базовая модель, скорее всего, ограничена пятью секундами.
Есть Draft Mode, который генерирует быстрее, но в качестве 640×352.
Бесплатно можно генерировать только в нём. На платной подписке за $10 в месяц можно создать примерно шесть 9-секундных роликов в 1080p, после чего придётся доплачивать. Генерация одного такого видео занимает 5–6 минут.
🔧 AI-инструменты и платформы
❯ Figma теперь с ИИ-редактором
Figma запустила революционную функцию «Prompt to edit». Больше никакого ручного пиксель-пушинга — теперь редактировать дизайны можно обычными текстовыми командами.
Что можно делать:
- Массово редактировать несколько фреймов одновременно.
- Добавлять контент — вставлять картинки и текст по описанию.
- Быстро делать ресайзы, например, генерировать мобильные версии из desktop-макетов.
- Создавать вариации, переключаясь между светлой и тёмной темой одним промптом.
- Собирать новый UI с нуля, создавая компоненты текстовыми командами.
Функция пока в закрытой альфе для 5000 пользователей на платных тарифах, но является частью большой стратегии Figma по интеграции ИИ.
Дизайн больше никогда не будет прежним.
❯ В Google Chrome встроили Gemini
Google выпустил одно из самых крупных обновлений для Chrome, встроив в браузер нейросеть Gemini. Общаться с ИИ теперь можно прямо в адресной строке.
Главное из обновления:
- Скоро появится возможность бронировать услуги, оформлять заказы и собирать информацию из нескольких вкладок.
- Встроенный Gemini Nano отвечает за безопасность: он детектит скам и фишинг.
- Появится смена паролей в один клик и поиск по истории.
Обновление доступно бесплатно и не требует подписки Google AI. Пока работает только на Windows и Mac в США и на английском языке.
🔗 Источник
❯ Gamma 3.0 — обновление ИИ для презентаций
Вышло крупное обновление Gamma 3.0 — популярной нейронки для создания презентаций, документов и сайтов.
Теперь сервис работает с полноценным ИИ-агентом, который сам ищет информацию в интернете, работает с референсами и вносит правки по текстовому промпту.
Платформа превращает идею в готовый визуальный проект с текстом и оформлением по одному запросу, а также поддерживает русский язык.
В бесплатной версии пользователи получают 400 кредитов при регистрации, которых хватит на несколько проектов. В платных тарифах увеличили лимиты и добавили доступ к API для автоматизации задач.
🧩 AI в обществе и исследованиях
❯ ИИ смог бы обзвонить всю планету за 6 суток
Современные голосовые ИИ-ассистенты способны обзвонить 8,2 млрд человек примерно за шесть суток. Такой оценкой поделилась директор по разработке компании Neuro.net Мария Бых.
Расчёт основан на том, что ИИ вроде GPT-4 отвечает быстрее человека (менее 100 мс против 200 мс) и может вести миллион параллельных разговоров.
Однако эксперт отмечает, что это чисто математическая гипотеза. На практике задача займёт несколько месяцев из-за множества ограничений: не у всех есть телефоны, часть звонков не пройдёт, а законы многих стран, разница в часовых поясах и необходимость повторных попыток сильно усложняют процесс.
Для реализации такого проекта потребовалась бы инфраструктура, сопоставимая с мощностями крупнейших мировых IT-гигантов. Пока глобальный обзвон остаётся мифом, но национальные системы оповещения уже эффективно работают.
🔗 Источник
❯ AI-очки от Meta* Ray-Ban Display
Meta* представила умные очки Ray-Ban Display со встроенным дисплеем. Марк Цукерберг назвал их «идеальным форм-фактором для персонального суперинтеллекта», который позволит получать доступ ко всем возможностям ИИ, оставаясь в настоящем моменте.
Новые очки за $800 оснащены небольшим цифровым дисплеем в правой линзе для просмотра уведомлений, камерами, динамиками и микрофонами. Они работают до 6 часов (до 30 часов с чехлом), весят всего 69 граммов и имеют 32 ГБ памяти.
*Meta признана экстремистской организацией и запрещена в РФ
🔗 Источник
❯ Хакеры из КНДР используют ИИ-картинки для атак
Северокорейские хакеры из группировки Kimsuky применили ChatGPT для генерации поддельных удостоверений личности, которые затем использовались в фишинговых кампаниях против граждан Южной Кореи. Об этом говорится в отчете южнокорейской компании Genians.
Злоумышленники создавали фальшивые изображения документов с помощью чат-бота, а затем рассылали их в письмах, содержащих ссылки на вредоносное ПО для кражи данных. Целями атак стали южнокорейские журналисты, исследователи и правозащитники, чья деятельность связана с Северной Кореей.
Исследователи Genians подтвердили, что, несмотря на запреты ChatGPT на создание госудостоверений, эти ограничения можно обойти, изменив формулировку запроса. Ранее северокорейские хакеры уже использовали ИИ для получения удаленной работы в американских технологических компаниях. OpenAI заявляла о блокировке подозрительных аккаунтов из КНДР, однако, как видно, эти меры оказались не до конца эффективными.
🔗 Источник
❯ Аудиоверсия дайджеста
❯ Заключение 🔮
На этой неделе всё! Grok 4 Fast от Маска задал новый тренд: гонка теперь идёт не только за мощностью, но и за максимальной эффективностью. Китайцы из Alibaba продолжают радовать крутыми опенсорс-релизами, от дипфейков в Wan 2.2 до исследовательского агента Tongyi DeepResearch.