Cognition Labs представили Devin — первого ИИ программиста

Проект от компании Cognition Labs, под названием Девин (Devin), может самостоятельно изучать неизвестные ему технологии, работать с чужими репозиториями и даже решать баги в них. Также он может натренировать и «отполировать» свои собственные ИИ модели (вроде LoRA).

Более того, Девин может самостоятельно решать задачи с фриланс бирж, например Upwork 😐

Я знаю, что все шутили, мол, «в будущем ИИ отнимет у нас работу, хаха» и так далее — однако, ребята, это уже скоро, а не в будущем. Помянем тех кто учится на программной инженерии, бизнес-информатике и смежных специальностях (передаю привет однокашникам из ВШЭ).

Если кратко описать как работает Девин, то будет выглядеть так:

  • Чат — через него Девин общается с человеком и описывает свои действия.
  • Консоль — благодаря ей он скачивает файлы, кидает запросы и прочие штуки сетевые и не только.
  • Редактор — в нём ИИ пишет код.
  • Браузер — Девин может открывать самостоятельно сайты и показывать результат своей работы.

Всё это Девин делает сам по себе, то есть он в прямом смысле автономный. Если раньше мы захотели сделать сайт и нам надо было просить код, а затем вручную его добавлять в условный блокнот, то теперь Девин может по запросу сделать всё за нас.

Девин не идеальный и ему ещё нужна помощь человека для решения большинства задач. Девина оценивали по SWE-Bench бенчмарку и выявили, что он уже решает 13.86% всех задач без какой-либо помощи — что превосходит все передовые модели у которых 1.96% без помощи и 4.80% с помощью.

Такие дела, ребята. Пора всем нам задуматься как мы будем адаптироваться к развитию искусственного интеллекта. И это не шутки.

Всю информацию про Девина можно почитать в официальном блоге Cognition Labs.

Подписывайтесь на мой Телеграм канал, если интересно почитать про ИИ, ноу- и лоукод, и прочие прелести жизни → @georgystories. На DTF и VC я тоже пишу, но немного реже :(

Также буду премного благодарен за донаты и буст канала

1.6K1.6K показов
4.3K4.3K открытий
11 репост
26 комментариев

однако, ребята, это уже скоро, а не в будущемК сожалению или к счастью-хз, но есть такая важная штука как принцип убывающей полезности. Каждая следующая революция будет даваться всё тяжелее и тяжелее. Соответственно прогнозирование уровня "оно за 10 лет из малосвязангых тестирования переросло в адекватную замену трейни-кодера значит скоро сможет заменить синьоров" тут может дать большущую ошибку. С другой стороны полностью отрицать возможность скорого появления который будет достаточно хорош чтобы заменить большую кучу кодеров нельзя. С третьей стороны не совсем ясно как рынок на это отреагирует. Программисты производят нематериальные блага, и удешевление разработки может как вытеснить с рынка свободные руки так и просто пнуть рынок в стороны намного более быстрого производства ещё большего числа продуктов и подпродуктов без пересыщения рынка и без больших сокращений.

Короче будущее туманно, но важно всё же сохранять здравый баланс между технооптимизмом, и технопессимизмом. Пользоваться новыми штуками, учиться взаимодействовать с ними эффективно, и таки да, как и всегда в этой профессии-доучиваться.)

Ответить

малосвязангых тестированияТам жолжно было быть "малосвязных текстиков".
Грёбаный т9.

Ответить

Праприетарщина....

Ответить

Комментарий недоступен

Ответить

Ну дак, а ты шо хотел))))

Ответить

Напоминает мне времена когда все упарывались по low-no code и говорили что эта шляпа заменит программиста. По итогу имеем несколько wall garden проектов, в которых юзер может как конструктор собирать однотипную байду а всякие вещи мудренее предефайна уже надо реализовывать ручками. Работал немного с Appsheet и там чтобы слать кастомные мейлы по тригеру приходилось свящывать приложение ещё с условным Zappier. Стоит ли говорить что и то и то требует денег за подписку/вызовы апи.

Ответить

Напоминает мне времена когда все упарывались по low-no code и говорили что эта шляпа заменит программиста.Заменит? Нет. Изменит индустрию так или иначе? Вполне.


По итогу имеем несколько wall garden проектовНоу- и лоу-код проектов огромное множество, плюс есть опенсорсные проекты.


в которых юзер может как конструктор собирать однотипную байду а всякие вещи мудренее предефайна уже надо реализовывать ручкамиСразу видно, что ты не разбирался нормально что к чему. Сложных и мощных инструментов хватает. Я пользуюсь Webflow, например — но есть тулзы вроде Wappler, WeWeb, AppSmith и прочие.


Работал немного с Appsheet и там чтобы слать кастомные мейлы по тригеру приходилось свящывать приложение ещё с условным Zappier. Стоит ли говорить что и то и то требует денег за подписку/вызовы апи.А в чём проблема-то? All-in-one инструментов не существует, а то что уже можно сделает впечатляет, потому что нанимать кучу разрабов или уметь тысячу и одну штуку делать не надо. Ясное дело это не заменяет какие-то суперсложные или очень нишевые вещи, но уже сейчас можно с нуля начать вливаться и постепенно реализовать крутые штуки.

Ответить