Я смотрел пример MNIST для новичков и обнаружил, что в этой части:
for i in range(1000):
batch_xs, batch_ys = mnist.train.next_batch(100)
sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})
изменение размера партии от 100 до отметки 204 приводит к тому, что модель не сходится. Он работает до 204, но в 205 и любом более высоком количестве, которое я пробовал, точность будет заканчиваться < 10%. Это ошибка, что-то о алгоритме, что-то еще?
Выполняется их двоичная установка для OS X, похоже, версия 0.5.0.