Он использует специально подобранный набор данных, который отфильтровывает некачественный или вредоносный текст, например спам, разжигание ненависти или дезинформацию.Это, кста, плохо. И это и в гпт4 есть. Штука в том, что вручную урезая набор данных по одному признаку ты гарантированно получаешь ухудшение качества обучения по всем фронтам. Т.Е. грубо говоря отфильтровал и убрал из набора расиссткие шутки, а нейронка хуже стала отвечать в том числе на вопросы про школьную физику. Это не я придумал, слышал от одного умного шарящего дядьки в подкасте.
Как он может шарить если например разработчики gpt до сих пор не могут понять как gpt понимает русский язык?) А он уже во всем шарит.Это по сути бета версии.Им еще долго обучаться.
Он использует специально подобранный набор данных, который отфильтровывает некачественный или вредоносный текст, например спам, разжигание ненависти или дезинформацию.Это, кста, плохо. И это и в гпт4 есть. Штука в том, что вручную урезая набор данных по одному признаку ты гарантированно получаешь ухудшение качества обучения по всем фронтам. Т.Е. грубо говоря отфильтровал и убрал из набора расиссткие шутки, а нейронка хуже стала отвечать в том числе на вопросы про школьную физику. Это не я придумал, слышал от одного умного шарящего дядьки в подкасте.
Как он может шарить если например разработчики gpt до сих пор не могут понять как gpt понимает русский язык?) А он уже во всем шарит.Это по сути бета версии.Им еще долго обучаться.