DTF — значит DaTaFrame. Разбираемся с 3 млн комментариев с DTF при помощи Data Science

Не так давно дорогой пользователь Карасик рассказал нам о том, что он смог посредством API сайта добыть почти три миллиона комментариев, а также поделился анализом собранной статистики. К моей великой радости, он оставил ссылку на дасатет, который решил исследовать и ваш покорный слуга.

DTF — значит DaTaFrame. Разбираемся с 3 млн комментариев с DTF при помощи Data Science
7777

Привет! Статья просто пушка бомба, очень много незнакомых мне слов, и это отлично
Могу кинуть ссылку на датасет с 25 миллионами комментов и постов, если все таки возьмёшься за это)
Если захочешь прям заняться, то могу попробовать выгрузить вообще со всеми параметрами, с количеством лайков на комменты, и кстати, с удаленными постами и комментами. Теоретическая возможность есть, просто займет больше времени.
По сути и пол года описывают +- те же закономерности, просто где-то больше, где-то меньше.
Если ты шаришь за машинное обучение и т.д., буду очень рад помощи или кооперации в дообучении модели на комментах. Очень хочется сделать ИИ-дтфера
А уровень токсичности уже исследовал @Инфернальный гавноед

8