БЕСПЛАТНО из 2D в 3D с нейросетью от TikTok для глубины изображений⁠⁠

Depth Anything - это проект TikTok, который анализирует изображение, определяет глубину сцены на них и придаёт объём и глубину изображению.

Вот пример использования Depth Anything.

Представьте, что у вас есть изображение сцены, и вы хотите оценить глубину каждого пикселя на изображении (то есть, насколько далеко каждый пиксель находится от камеры). Вы можете использовать нейросеть для получения этой информации. Это может быть полезно во многих приложениях, таких как автономное вождение, робототехника, дополненная реальность и многое другое.

Модель обучена на 1,5 миллионах размеченных изображений и более 62 миллионов неразмеченных изображений. Например, в приложениях VR и AR понимание глубины сцены критично для создания реалистичного восприятия пространства и взаимодействия пользователя с виртуальными объектами.

Что хорошего:

- Картинки можно импортировать паком или по одной, а экспортировать напрямую в свой проект.

- Проект c открытым кодом выложен и на GitHub

-Проект выложен и на Hugging Face. Кто-то может попробовать нейросеть, а кто-то может использовать ее в онлайн-приложениях через интерфейс Hugging Face. Проекты, размещенные на Hugging Face, могут быть использованы разработчиками для быстрого доступа к готовым моделям и интеграции их в свои приложения или проекты.

Таким образом, модель Depth Anything представляется в виде готового решения для задачи оценки глубины визуальных данных и может быть использована разработчиками, желающими внедрить такую функциональность в свои приложения или исследовательские проекты.

Основные особенности:

  • Оценка относительной глубины: Модели могут предоставлять оценку относительной глубины для любого данного изображения.
  • Оценка метрической глубины: Модели могут быть дополнительно настроены с информацией о метрической глубине из NYUv2 или KITTI.
  • ControlNet, основанный на Depth Anything: Это предлагает более точную синтезированную информацию, чем предыдущий ControlNet, основанный на MiDaS.
  • Понимание сцены на высоком уровне: Кодировщик Depth Anything может быть дополнительно настроен для задач восприятия на высоком уровне, например, семантической сегментации.

Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпишитесь на мой телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса, работы и учебы.

2.6K2.6K показов
203203 открытия
1 комментарий

пока только некоторые ракурсы не плохо выходят

Ответить