Дописал тут бота, который анализирует статьи на DTF

Пока что использую и тестирую его единолично, но потом возможно куда-нибудь внедрим

Я уже говорил, что собираюсь писать себе автоматического помощника, который будет собирать статьи со всего сайта. Ну, основные функции дописал более менее. Он работает на очень диковинных эвристиках, потому пока не решаюсь его куда-либо внедрять. Но, вот пока смотрю как работает.

Опишу принцип работы:

  • Он собирает все посты со всех подсайтов, которые могут быть интересны массовому пользователю и может потенциально получить репост (например, там есть Виабу и Автогонки, но нет Драмы, Гачимучи и Мемы) и со всех известных блогеров (из того списка, что я собираю). Посты от редакции ботом не учитываются.
  • Он собирает о них всю известную статистику: количество просмотров, плюсов, закладок, комментариев, слов и медиафайлов.
  • Статистика скачивается 4 раза: через час после публикации, через два часа, через три часа и через 12 часов.
  • У бота есть механизм рекомендаций: только некоторые статьи из тех, что он находит на сайте, он предлагает рассмотреть.
  • Рекомендации рассчитываются на основе "рейтинга интереса": учитываются и складываются все 6 показателей из статистики. Все 6 показателей равноценны. Если рейтинг выше определённого числа - статью рекомендуют и забывают про неё.
  • Рейтинг интереса подсчитывается каждый раз при сборе статистики, то есть если пост не смог набрать нужные показатели за час, то рейтинг будет снова высчитан на втором часу и так далее.
  • Рейтинг учитывает количество подписчиков у подсайта/блогера, то есть например если для какого-нибудь Офтопа целевые показатели по просмотрам - 4000, то для Блогосферы с 8к подписчиков - 1000, а для блогера с 20 подписчиками - 15.
  • В данный момент барьер для рейтинга указан таким образом, что каждый день с сайта отбирается около 30 постов разного содержания. Сам рейтинг выражает большую склонность блогам (причём, большую склонность!), чем материалам из подсайтов, надеюсь подправить это в дальнейшем.

Ниже указан результат подсчёта рейтинга интереса на основе постов опубликованных за последние 5 дней (для рейтинга смотреть поле score)

Дописал тут бота, который анализирует статьи на DTF

Опять же, это не окончательный вариант работы. Просто хотел поделиться текущими результатами.

146146 открытий
10 комментариев

Минимотивация. Спасибо, что делаете крутые вещи для DTF. 

Ответить

Уважаемо.

Ответить

Комментарий недоступен

Ответить

Комментарий недоступен

Ответить