Снижение размерности с использованием PCA и t-SNE Мы рассмотрим два популярных алгоритма снижения размерности: Главные Компоненты (Principal Component Analysis, PCA) и t-распределение Сtochastic Neighbor Embedding (t-SNE).
Наивный байесовский классификатор Наивный байесовский классификатор (Naive Bayes) является одним из самых простых и эффективных алгоритмов машинного обучения, используемых для задач классификации.
Метод опорных векторов (SVC, SVR) Метод опорных векторов - это мощный инструмент машинного обучения, который можно использовать для решения задач классификации и регрессии.
Линейные модели: LogisticRegression и LinearRegression В этой статье я расскажу о двух популярных линейных моделях: логистической регрессии (LogisticRegression) и линейной регрессии (LinearRegression). Мы рассмотрим принципы работы этих моделей, их применения и реализации на Python с помощью библиотек scikit-learn и TensorFlow.
Заполнение пропущенных значений Как специалист по обработке данных, одной из самых распространенных проблем, с которыми я сталкиваюсь при работе с реальными наборами данных, является обработка пропущенных значений.
Обработка категориальных признаков Работая с данными в задачах машинного обучения, мне часто приходится иметь дело с категориальными признаками - переменными, которые могут принимать одно из ограниченного числа возможных значений, например, пол, цвет или город.
Масштабирование признаков Сегодня я хочу поделиться с вами своим опытом работы с масштабированием признаков (Feature Scaling) в машинном обучении. Это очень важная тема, так как правильное масштабирование признаков может значительно улучшить качество моделей.
Разделение данных на обучающую и тестовую выборки Когда я начинал заниматься машинным обучением, одной из первых важных концепций, с которой я столкнулся, было разделение данных на обучающую и тестовую выборки. Это критически важный шаг, который помогает оценить реальную производительность модели и избежать проблемы переобучения (overfitting).
Загрузка встроенных наборов данных в scikit-learn В scikit-learn, популярной библиотеке машинного обучения для Python, есть несколько встроенных наборов данных, которые можно использовать для обучения и тестирования моделей машинного обучения.
Оценка качества моделей в машинном обучении Я - опытный инженер по машинному обучению, и сегодня я хотел бы поделиться своими мыслями и опытом в области оценки качества моделей машинного обучения.