Метод опорных векторов (SVC, SVR) Метод опорных векторов - это мощный инструмент машинного обучения, который можно использовать для решения задач классификации и регрессии.
Линейные модели: LogisticRegression и LinearRegression В этой статье я расскажу о двух популярных линейных моделях: логистической регрессии (LogisticRegression) и линейной регрессии (LinearRegression). Мы рассмотрим принципы работы этих моделей, их применения и реализации на Python с помощью библиотек scikit-learn и TensorFlow.
Заполнение пропущенных значений Как специалист по обработке данных, одной из самых распространенных проблем, с которыми я сталкиваюсь при работе с реальными наборами данных, является обработка пропущенных значений.
Обработка категориальных признаков Работая с данными в задачах машинного обучения, мне часто приходится иметь дело с категориальными признаками - переменными, которые могут принимать одно из ограниченного числа возможных значений, например, пол, цвет или город.
Масштабирование признаков Сегодня я хочу поделиться с вами своим опытом работы с масштабированием признаков (Feature Scaling) в машинном обучении. Это очень важная тема, так как правильное масштабирование признаков может значительно улучшить качество моделей.
Разделение данных на обучающую и тестовую выборки Когда я начинал заниматься машинным обучением, одной из первых важных концепций, с которой я столкнулся, было разделение данных на обучающую и тестовую выборки. Это критически важный шаг, который помогает оценить реальную производительность модели и избежать проблемы переобучения (overfitting).
Загрузка встроенных наборов данных в scikit-learn В scikit-learn, популярной библиотеке машинного обучения для Python, есть несколько встроенных наборов данных, которые можно использовать для обучения и тестирования моделей машинного обучения.
Оценка качества моделей в машинном обучении Я - опытный инженер по машинному обучению, и сегодня я хотел бы поделиться своими мыслями и опытом в области оценки качества моделей машинного обучения.
Загрузка и предобработка данных различных форматов Загрузка и предобработка данных - это первый и очень важный этап в любом проекте по анализу данных или машинному обучению. От качества данных напрямую зависит конечный результат. Поэтому я всегда уделяю много внимания этому процессу.
Переобучение и недообучение в ML Я всегда был заинтересован в машинном обучении и его потенциале в решении сложных задач. Но с самого начала моей карьеры в этой области я столкнулся с двумя важными концепциями: переобучением и недообучением.