Matrix Factorization Модели Matrix Factorization - это фундаментальный подход в рекомендательных системах, который представляет пользователей и items в общем латентном пространстве. В этой главе мы рассмотрим три модели: SVD, SVD++ и ALS.
Простые но Эффективные Модели В этой главе мы рассмотрим две модели, которые доказывают, что простота может быть мощной: EASE и SLIM. Обе модели основаны на линейных методах, но достигают результатов, сравнимых с гораздо более сложными deep learning подходами.
Подготовка данных Правильная подготовка данных - ключевой этап в построении рекомендательной системы. В этой главе мы подробно рассмотрим все аспекты работы с данными: от загрузки до создания обучающих батчей.
Кейс : построение рекомендательной системы шаг за шагом Представим, что у нас есть классический сет данных: MovieLens 100K — оценки пользователей фильмов («userId», «movieId», «rating», «timestamp») — и мы хотим построить top-N рекомендательную систему, используя библиотеку sota-recommender.
Мой путь к релизу библиотеки рекомендаций Привет! Сегодня я рад поделиться результатом длительного проекта — моей первой публичной библиотекой для рекомендательных систем: sota‑recommender.
10 ошибок в pandas, которые замедляют ноутбуки в 10 раз — и быстрые фиксы Вы когда-нибудь запускали ячейку, налили кофе… и она всё ещё крутится? Ниже — 10 самых частых антипаттернов в pandas, которые делают ноутбуки медленными, и быстрые, практичные исправления с примерами кода.
Нейросеть в лесу - Лог №0 Первые шаги, первые проблемы Ну что ж, комплектующие еще в пути, но процесс уже начался. Пишу сразу сюда, чтобы по свежим следам ничего не забыть, что успел сделать.
Нейросеть в лесу — проект выходного дня Порой лучшие идеи рождаются тогда, когда у тебя наконец появляется время остановиться. Эти выходные стали именно такими: без спешки, без планов, но с внезапным приливом вдохновения. Возникла простая мысль: а что если совместить природу и машинное обучение?
Model Context Protocol (MCP) – открытый стандарт подключения ИИ к данным Model Context Protocol (MCP) – это открытый стандарт, призванный упростить подключение искусственного интеллекта к внешним данным и инструментам.
Управление дисбалансом классов с помощью imbalanced-learn: Практические примеры и рекомендации В задачах машинного обучения часто возникает проблема дисбаланса классов, когда один класс представлен значительно больше, чем другой. Это может привести к смещению модели в сторону мажоритарного класса, снижая качество предсказаний для редких, но зачастую критически важных классов.