Семен Лобачевский

Семен Лобачевский

Всем привет! Работаю в НИУ ВШЭ, в этот блог пишу заметки про ML, генеративные нейронные сети и всё что связано с аналитикой больших данных.
📍 Россия, Москва https://www.hse.ru/staff/lobachevskiy

Разделение данных на обучающую и тестовую выборки

Когда я начинал заниматься машинным обучением, одной из первых вещей, с которой я столкнулся, было разделение имеющихся данных на две части - обучающую выборку (training set) и тестовую выборку (test set). Это необходимо для того, чтобы проверить, насколько хорошо обученная модель работает на новых, ранее не виденных данных. Обычно я
1 min read

Типы задач машинного обучения (классификация, регрессия, кластеризация)

В своей работе в области машинного обучения я сталкиваюсь с различными типами задач, каждая из которых требует своего подхода. Три основных типа задач, с которыми я чаще всего имею дело - это классификация, регрессия и кластеризация.
2 min read

Сравнение scikit-learn с другими библиотеками машинного обучения

Как специалист по машинному обучению, я работал с различными библиотеками и фреймворками для решения задач анализа данных и построения моделей. Хотя scikit-learn является одной из моих любимых библиотек, стоит также рассмотреть и другие популярные варианты.
2 min read

Основные особенности и преимущества библиотеки scikit-learn

Как специалист по анализу данных и машинному обучению, я часто использую библиотеку scikit-learn в своей работе. Эта библиотека стала моим незаменимым инструментом благодаря своим многочисленным особенностям и преимуществам. Позвольте мне поделиться с вами некоторыми из них.
2 min read

Использование Pandas в машинном обучении

Я работаю в области машинного обучения уже несколько лет и за это время успел попробовать множество различных инструментов и библиотек. Однако, одной из самых полезных и часто используемых мной библиотек остается Pandas.
2 min read

Работа с большими данными и оптимизация производительности

Работа с большими данными и оптимизация производительности являются важными аспектами при разработке на Python. Существует множество инструментов и подходов, которые помогают эффективно обрабатывать большие объемы данных. Рассмотрим некоторые из них подробнее.
3 min read

Визуализация данных с помощью Matplotlib и Seaborn

Привет! Сегодня я хочу поделиться своим опытом визуализации данных на Python с помощью двух мощных библиотек - Matplotlib и Seaborn. Эти инструменты позволяют создавать красивые и информативные графики, которые помогают лучше понять и проанализировать данные.
3 min read

Подписаться на новости Nerd IT

Не пропустите последние выпуски. Зарегистрируйтесь сейчас, чтобы получить полный доступ к статьям.
jamie@example.com
Подписаться