Анализ редакционного контента DTF
Листая в очередной раз DTF, я наткнулся на примечательный комментарий Олега Чимде:
А ещё можете заодно посчитать редакционный контент с галочками и вычислить, какой процент приходится на игры, а какой на булки. Чтобы потом не пришлось делать такие посты. У меня от вас аж уши загорелись.
А что? Давайте подсчитаем и посмотрим.
Исходные данные
За основу я взял данные, отдаваемые rss-лентой «Свежее», куда, как я понимаю, попадают все редакционные материалы (с галочкой). Как оказалось позже, попадают туда не весь контент, но будем работать с тем, что есть.
Чтобы не тратить много времени на анализ, я ограничился выборкой материалов за последние две недели — с 26 июня по 11 июля 2022 года. Всего за этот период в ленте набралось 376 записей.
А что считать-то будем?
При анализе редакционных материалов я разделил контент на два типа: «якорный» и «сосисочный». Взяв за основу самоопределение DTF как платформы, размещённое на странице «О проекте», за «якорный» контент будем считать тексты, посвящённые «играм, кино, разработке и технологиям». За «сосисочный», соответственно, весь остальной контент, не укладывающийся в указанные темы.
Ну и как определить тип контента?
Исключительно субъективно. Я внимательно прочитал заголовки всех 376 материалов и расставил флаги, помечающие «сосисочный» контент.
Чтобы не быть голословным, представляю вам исходные данные. Из 376 записей «сосисочными» оказалось 43:
Но ведь Олег говорил про «булки» и «игры»!
Действительно, в комментарии Олега Чимде речь шла о процентном соотношении между контентом про видеоигры и контентом «булочным», к которому, судя по всему, можно отнести все неигровые материалы — включая заметки про кино, технологии, железо и так далее.
Методика анализа и соотнесения контента осталась субъективной, но главный критерий я описал выше. При желании можно посмотреть исходные данные.
Из 376 записей «булочными» оказались 197:
Повторюсь, всё это субъективно, потому что критерии причисления материала к «игровой» тематике довольно размыты. Скажем, новости о процессорах или видеокартах непосредственно к играм отношения не имеют, поэтому такие тексты попали к «булкам«. Туда же попали материалы о разработчиках, напрямую с играми не связанные, вроде продажи бизнеса Wargaming, забастовках в Bethesda и сокращениях в Unity. В любом случае, все исходные данные вы можете обработать и проанализировать самостоятельно.
И что?
Ничего. Никаких выводов, просто голые данные для вашего внимания. Олег сказал — пользователь сделал.