Александр Дударев

+4138
с 2019

Разработчик игр. В работе - They Are Here.

133 подписчика
20 подписок

Сейчас, все веса одинаковые. Я пробывал по разному. Например давать больший вес первым тэгам.

Да, для конкретных игр, ближайшие часто бывают не точными. Потому что больший приоритет отдаётся "большой картине". Нужно будет подумать, как улучшить алгоритм.

Да, парсинг. Но парсил не я. Взял готовую базу. Если займусь развитием проекта, буду постоянно парсить и обновлять свою базу.

Мелкие игры есть. И айдл кликеры. Просто страничка Zero Stress King появилась 30 января, уже после сбора базы данных. Поэтому не попала.

Но могут быть дырки в базе, не исключаю.

В целом да. Типичный индюк на стиме замерзает :'(

На 15 ближайших соседях. Разреженность 10%
Laplacian Score - отличная идея. Можно попробывать.
В текущей реализации используется TF-IDF с max_features=5000, который косвенно выполняет фильтрацию (оставляет только топ-5000 частых тегов по TF-IDF весу).

Ну, тогда будет перекос в сторону:
1. Онлайн игр.
2. Новых игр.

Какой-нибудь Half-Life 2 поблекнет. А он должен быть явно яркой звёздочкой на карте.

Но опять же. В теории можно сделать просто разные режимы отображения: по отзывам / по онлайну.

Ну если распробывали - значит, всё жн купили. Пусть и не на старте. Учитываются продажи за всю жизнь проекта.

Но вообще, могу просто несколько режимов сделать: отзывы, онлайн, рейтинг положительных и т.п.

1

А чем онлайн лучше? Отзывы +- коррелируют с продажами.

Ток через 3 буквы открывается. Hugging Face так решил. Не я =(