Кто убил интеллект? Расследование деградации ChatGPT, Claude, Gemini и других LLM

Всем привет! Недавно я вновь сменил свою основную LLM-модель. Долгое время пользовался Claude, потом перешел на ChatGPT, затем на Gemini, и вот опять оплатил Claude и снова отменил подписку. Почему? Потому что Gemini, который поначалу казался невероятно мощным, в какой-то момент просто перестал справляться с моими основными задачами, а до этого так…

Кто убил интеллект? Расследование деградации ChatGPT, Claude, Gemini и других LLM
13
4

Исследование Anthropic: Ведущие ИИ-модели склонны к "вредоносному поведению" в стресс-тестах!

Игорь Телегин на связи! Коллеги, новое исследование от Anthropic заставляет задуматься о поведении ведущих AI-моделей. Anthropic опубликовала результаты нового исследования безопасности, в котором изучалось поведение 16 ведущих моделей искусственного интеллекта от OpenAI, Google, xAI, DeepSeek и Meta. Тестирование в контролируемой смоделированной с…

Исследование Anthropic: Ведущие ИИ-модели склонны к "вредоносному поведению" в стресс-тестах!
1

Cursor AI: Пишем сайты голосом (даже если не кодер!). Гайд + ТОП промптов!

Игорь Телегин на связи! Коллеги, Наваль Равикант как-то сказал: "Искусственный интеллект не заменит программистов. Он поможет программистам заменить всех остальных". Глядя на Cursor AI, начинаешь в это верить. Это не просто очередной редактор кода, а настоящий AI-напарник на базе VS Code, который пишет код за вас, объясняет его и помогает решать сл…

Cursor AI: Пишем сайты голосом (даже если не кодер!). Гайд + ТОП промптов!

«Кодить без мозга: Почему агентный ИИ — это зло, и как выжить в эпоху автономных нейросетей»

Привет, коллеги! Игорь Телегин на связи. Сегодня расскажу, как потратил неделю, тестируя «умные» ИИ-агенты (Cursor, Vindserf, Goose и другие), чтобы выяснить: можно ли доверить код машине, если ты сам не программист? Спойлер: лучше не надо. Но обо всём по порядку.

vibe-code 80x

Теперь я AI agent prompt manager

Все говорят, что скоро разработчиков заменит AI. Что скоро написание кода будет автоматизировано прям на 146%, и нам останется только говорить "сделай хорошо". OpenAI планируют запустить в продажу, а точнее в помесячную аренду, агенты, один из которых будет работать разработчиком за 10000$ в месяц. Из хорошего, работает бедолага 24/7 без выгорания…

Тем временем, я решил проверить, а каково это будет работать в компании, где не будет отдела разработки, а, скажем, будет ряд агентов и какой-нибудь супервайзер (не знаю, как назвать эту должность, пускай будет AI agent prompt manager, почему бы и нет?) И так, давайте знакомиться, я - Игорь, AI agent prompt manager, и я сделал продукт за 3 уикенда.…

15
2

Claude 3.7 Sonnet прошла игру Pokémon Red во время трансляции на Twitch

Предыдущая версия 3.5 Sonnet не смогла этого сделать — у неё не было возможности «рассуждений».

  • Компания Anthropic провела стрим Claude Plays Pokemon на Twitch: рассуждающая модель Claude 3.7 Sonnet играла в игру Pokémon Red для консоли Game Boy 90-х годов.
  • Модели дали возможность управлять приставкой. В левой части экрана отображались «мысли» Claude, а в правой — его действия в игре.
108
51
7
2
1
1

🏆 Битва всех популярных чатов: ChatGPT, Claude, LeChat, DeepSeek, QWEN, Gemini, Grok чей код лучше?

Друзья, в этом видео мы проведем честное сравнение всех популярных языковых моделей на реальной задаче! Я дам им задание переписать моё React-приложение для сравнения изображений в обычный HTML+JS. Какая модель справится лучше всех?

5
1
1

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Всем привет! В последнее время я заметил множество постов и статей в русскоязычном сегменте интернета, которые ссылаются на одно интересное исследование, но интерпретируют его… скажем так, довольно своеобразно. Часто можно встретить заголовки вроде «ИИ научился обманывать чтобы спастись!» или «Нейросети вышли из-под контроля и пытались сбежать!». Э…

6

Рандомный праздничный Suno на 26 августа 2024

Культура и Искусство

Рандомный праздничный Suno на 25 августа 2024

Культура и Искусство

1

Рандомный Праздничный Suno на 24 августа 2024

Культурные и исторические праздники

1

Рандомный Праздничный Suno на 23 августа 2024

Исторические события:

1
1