2 комментария

Текстовая версия здесь, читается за час-полтора. Но ИМХО не очень удачная статья, потому что невозможно за одну лекцию охватить настолько большой объем информации, чтобы действительно разъяснить архитектуру трансормеров и GPT в частности.

https://writings.stephenwolfram.com/2023/02/what-is-chatgpt-doing-and-why-does-it-work/

1
Ответить

Степан Вольфрам хуйни не скажет. Но 3 часа?

Ответить