Nvidia представила Chat with RTX - свой аналог ChatGPT, который работает локально.

Демо модели весит 35 ГБ и доступно бесплатно всем владельцам видеокарт RTX 3000 или 4000 серии.

Пользовательский интерфейс модели
153153

Довольно простая реализация, ничего уникального в плане этого чата nvidia не сделала, такой чат может собрать любой человек по гайду из ютуба (llamaindex RAG chat), весь исходный код открыт, под капотом llamaindex, две открытые модели mistal 7b и llama2 13b (4b квантованные, иначе работало бы только на 3090 и 4090), фронт на gradio, на котором тот же SD Automatic1111 или text-generation web ui работает, установщик ставит miniconda, куда ставит все зависимости, кидает модель в папку и готово.

3