Продолжаю вайбкодить свою платформу. И вот что выяснилось...
Если пытаться сделать модерацию независимой, корректной, крутой и неподкупной при помощи ИИ... Тогда половина комментариев с ДТФ такую модерацию не проходят...
Надо понимать, что нейросеть это такая штука, которая настроена так, чтобы угодить пользователю. Сказали искать шейминг, буллинг, ненависть и вражду - будет вырывать это все из под земли.
На любой комментарий-нытье отвечают - соберись, тряпка! Нейросеть говорит, ну нельзя так, некультурно же, оскорбительно. Человек почитает и роскомнадзорнется...
Вот я и пытаюсь понять - токсичные комментарии это фишка ДТФ или все же надо их как-то поменьше, помягше...
А промпт уже разрастается раз за разом, и все никак не настрою как мне хочется, чтобы и мат пропускал, и намеки всякие, но и оскорбления не пропускал и т.д.
Может у кого есть опыт в составлении таких промптов? Ну и вообще - какие комментарии хотите видеть, а какие нет?