Я работаю над глубокой обучающей моделью, используя Google TensorFlow. Модель должна использоваться для сегментов и ярлыков.
- Я использую набор SiftFlow dataset, который имеет 33 семантических классов и изображений с 256x256 пикселей.
- В результате на моем конечном слое с использованием свертки и деконволюции я прихожу к следующему тензору (массиву) [256, 256, 33].
- Далее я хотел бы примените Softmax и сравните результаты с семантической меткой размера [256, 256].
Вопросы: Должен ли я применять среднее усреднение или argmax к моему последнему слою, чтобы его форма становилась [256, 256,1], а затем пробивала каждый пиксель и классифицировала, как если бы я классифицировал экземпляры 256x256? Если да, то как, если нет, какие другие варианты?