Моя цель - создать классификатор multicalss.
Я построил конвейер для извлечения функций, и он включает в качестве первого шага трансформатор StringIndexer для сопоставления каждого имени класса с меткой, эта метка будет использоваться на этапе обучения классификатора.
В трубопроводе установлен учебный комплект.
Испытательный набор должен быть обработан установленным конвейером для извлечения тех же векторов признаков.
Зная, что мои файлы тестовых наборов имеют одинаковую структуру набора тренировок. Возможный сценарий здесь заключается в том, чтобы столкнуться с невидимым именем класса в тестовом наборе, в этом случае StringIndexer не сможет найти метку, и будет создано исключение.
Есть ли решение для этого случая? или как мы можем избежать этого?