Семен Лобачевский

Семен Лобачевский

Всем привет! Работаю в НИУ ВШЭ, в этот блог пишу заметки про ML, генеративные нейронные сети и всё что связано с аналитикой больших данных.
📍 Россия, Москва https://www.hse.ru/staff/lobachevskiy

Линейные модели: LogisticRegression и LinearRegression

В этой статье я расскажу о двух популярных линейных моделях: логистической регрессии (LogisticRegression) и линейной регрессии (LinearRegression). Мы рассмотрим принципы работы этих моделей, их применения и реализации на Python с помощью библиотек scikit-learn и TensorFlow.
2 min read

Обработка категориальных признаков

Работая с данными в задачах машинного обучения, мне часто приходится иметь дело с категориальными признаками - переменными, которые могут принимать одно из ограниченного числа возможных значений, например, пол, цвет или город.
1 min read

Разделение данных на обучающую и тестовую выборки

Когда я начинал заниматься машинным обучением, одной из первых важных концепций, с которой я столкнулся, было разделение данных на обучающую и тестовую выборки. Это критически важный шаг, который помогает оценить реальную производительность модели и избежать проблемы переобучения (overfitting).
2 min read

Загрузка и предобработка данных различных форматов

Загрузка и предобработка данных - это первый и очень важный этап в любом проекте по анализу данных или машинному обучению. От качества данных напрямую зависит конечный результат. Поэтому я всегда уделяю много внимания этому процессу.
3 min read

Подписаться на новости Nerd IT

Не пропустите последние выпуски. Зарегистрируйтесь сейчас, чтобы получить полный доступ к статьям.
jamie@example.com
Подписаться