Если кому надо - сделал еще один датасет
Тут комментарии и ответы на них, но без ограничений на лайки и длину сообщения. Рассчитана токсичность! 22Гб отборного щитпоста с DTF. Только я ошибся - post_title это на самом деле post_body
Если честно, даже не верится, что когда-то на DTF могли осилить такое количество текста и осознанно комментировать его.
А почему эта тема (кто знает, тот знает) на DTF вообще никак не комментируется? Её трут или что?
Хочу выразить свою глубочайшую признательность этому замечательному коммунити за то, что не только терпит мои посты, но и оставляет свои RE:4cti0n$ на них, а кому-то, возможно, даже действительно нравятся мои всратые мемесы собственного производства. Спасибо, благодаря вам в блоге продолжат появляться посты с дурацкими картинощками про DTF, ZZZ, но…
Думал, "ну щас быстренько пофиксим и пойдём дальше", но увлёкся слегка...
Ещё и неугодные комментарии удаляют. Браво, комитет и модерация, просто лучшие. Ну либо у вас маркотологу 3 года и ему смешно становится от пестика и тычинки.
В правилах DTF указано, что можно выкладывать только сисики и только в подсайте «О, Порно». Но в редакторе можно «Отметить 18+», так что, с этой плашкой можно постить сисики в свой блог? И все еще нужно заглушать спойлером?
Я собрал пожелания огромного количества людей, и вот что из этого получилось. Интересует мнение каждого. Не оставайтесь в стороне!
Пожалуйста, не кидайте в шб, текст чисто исследовательских целях
Если тут есть желающие поковырять комменты, держите структурированный датасет! В нем также рассчитана токсичность комментариев.
За ее расчет огромное спасибо моему сэнсэю Никите! Внутри поста - структура датасета
Красиво
Можно использовать для расчета количества ГЕБНИ
А Нейро-ДТФ будет?
Правда ей надо будет прописать контроль за базаром (а точнее проверять "нужно ли комментировать увиденное" и "сгенерированный ответ говно говна и ретрайнуть или можно постилировать?")
В процессе. Для этого датасет и делался как раз
Нахуя а главное
Надо