Анализ редакционного контента DTF

Листая в очередной раз DTF, я наткнулся на примечательный комментарий Олега Чимде:

А ещё можете заодно посчитать редакционный контент с галочками и вычислить, какой процент приходится на игры, а какой на булки. Чтобы потом не пришлось делать такие посты. У меня от вас аж уши загорелись.

Олег Чимде, заместитель главного редактора DTF

А что? Давайте подсчитаем и посмотрим.

Исходные данные

За основу я взял данные, отдаваемые rss-лентой «Свежее», куда, как я понимаю, попадают все редакционные материалы (с галочкой). Как оказалось позже, попадают туда не весь контент, но будем работать с тем, что есть.

Чтобы не тратить много времени на анализ, я ограничился выборкой материалов за последние две недели — с 26 июня по 11 июля 2022 года. Всего за этот период в ленте набралось 376 записей.

А что считать-то будем?

При анализе редакционных материалов я разделил контент на два типа: «якорный» и «сосисочный». Взяв за основу самоопределение DTF как платформы, размещённое на странице «О проекте», за «якорный» контент будем считать тексты, посвящённые «играм, кино, разработке и технологиям». За «сосисочный», соответственно, весь остальной контент, не укладывающийся в указанные темы.

Ну и как определить тип контента?

Исключительно субъективно. Я внимательно прочитал заголовки всех 376 материалов и расставил флаги, помечающие «сосисочный» контент.

На основе rss-ленты "Свежее", за период с 26 июня по 11 июля 2022 года
На основе rss-ленты "Свежее", за период с 26 июня по 11 июля 2022 года

Чтобы не быть голословным, представляю вам исходные данные. Из 376 записей «сосисочными» оказалось 43:

Музыка, еда, комиксы, манга, книги и мобильные технологии не упоминаются в разделе «О проекте», поэтому их из «якорного» контента материалы на подобные тематики я исключил.
Музыка, еда, комиксы, манга, книги и мобильные технологии не упоминаются в разделе «О проекте», поэтому их из «якорного» контента материалы на подобные тематики я исключил.

Но ведь Олег говорил про «булки» и «игры»!

Действительно, в комментарии Олега Чимде речь шла о процентном соотношении между контентом про видеоигры и контентом «булочным», к которому, судя по всему, можно отнести все неигровые материалы — включая заметки про кино, технологии, железо и так далее.

На основе rss-ленты «Свежее», за период с 26 июня по 11 июля 2022 года
На основе rss-ленты «Свежее», за период с 26 июня по 11 июля 2022 года

Методика анализа и соотнесения контента осталась субъективной, но главный критерий я описал выше. При желании можно посмотреть исходные данные.

Из 376 записей «булочными» оказались 197:

Повторюсь, всё это субъективно, потому что критерии причисления материала к «игровой» тематике довольно размыты. Скажем, новости о процессорах или видеокартах непосредственно к играм отношения не имеют, поэтому такие тексты попали к «булкам«. Туда же попали материалы о разработчиках, напрямую с играми не связанные, вроде продажи бизнеса Wargaming, забастовках в Bethesda и сокращениях в Unity. В любом случае, все исходные данные вы можете обработать и проанализировать самостоятельно.

И что?

Ничего. Никаких выводов, просто голые данные для вашего внимания. Олег сказал — пользователь сделал.

100
28 комментариев