Разделение данных на обучающую и тестовую выборки
Когда я начинал заниматься машинным обучением, одной из первых вещей, с которой я столкнулся, было разделение имеющихся данных на две части - обучающую выборку (training set) и тестовую выборку (test set). Это необходимо для того, чтобы проверить, насколько хорошо обученная модель работает на новых, ранее не виденных данных.
Обычно я