Подписаться

Семен Лобачевский

Всем привет! Работаю в НИУ ВШЭ, в этот блог пишу заметки про ML, генеративные нейронные сети и всё что связано с аналитикой больших данных.

📍 Россия, Москва https://www.hse.ru/staff/lobachevskiy

Матрица ошибок

Матрица ошибок - это один из самых полезных инструментов для оценки качества моделей машинного обучения в задачах классификации. Она позволяет наглядно увидеть, насколько хорошо модель предсказывает целевую переменную и какие ошибки допускает.

Метрики регрессии

Привет! Сегодня я расскажу тебе о важных метриках, которые используются для оценки качества моделей регрессии: MAE, MSE, RMSE и R^2. Давай разберемся, что они означают, как считаются и когда лучше применять каждую из них. Я также приведу примеры расчета этих метрик на Python.

Метрики классификации

Сегодня я расскажу вам о важных метриках, которые используются для оценки качества моделей классификации в машинном обучении. Мы рассмотрим такие метрики как accuracy, precision, recall, f1-score и ROC-AUC.

Оценка важности признаков

Как специалист по машинному обучению, я часто сталкиваюсь с задачей настройки гиперпараметров моделей и оценки важности признаков. Правильный подбор гиперпараметров и отбор наиболее информативных признаков критически важны для достижения высокого качества моделей.

Кросс-валидация

Сегодня я хочу поделиться своим опытом настройки гиперпараметров моделей машинного обучения с помощью кросс-валидации.

Стратегии поиска гиперпараметров: Grid Search и Random Search

В машинном обучении гиперпараметры являются важными настройками, которые влияют на процесс обучения модели, но не могут быть обучены сами по себе на основе данных.

Что такое гиперпараметры

Гиперпараметры являются важной концепцией в машинном обучении и глубоких нейронных сетях.

Кластеризация: K-Means, DBSCAN и другие алгоритмы

Кластеризация - это задача беспозывного обучения, которая заключается в разделении набора данных на группы, или кластеры, объектов с похожими характеристиками.

Снижение размерности с использованием PCA и t-SNE

Мы рассмотрим два популярных алгоритма снижения размерности: Главные Компоненты (Principal Component Analysis, PCA) и t-распределение Сtochastic Neighbor Embedding (t-SNE).

Наивный байесовский классификатор

Наивный байесовский классификатор (Naive Bayes) является одним из самых простых и эффективных алгоритмов машинного обучения, используемых для задач классификации.