Я сомневаюсь, правильно ли настроен тензор на моем поле gpu, так как он примерно на 100 раз медленнее на итерацию для обучения простой модели линейной регрессии (batchsize = 32, 1500 входных функций, 150 выходных переменных) на моей машине fancy gpu, чем на моем ноутбуке.
Я использую Titan X с современным процессором и т.д. nvidia-smi говорит, что я использую только 10% gpu, но я ожидаю, что из-за небольших партиций. Я не использую feed_dict для перемещения данных в граф вычислений. Все идет через tf.decode_csv и tf.train.shuffle_batch.
Есть ли у кого-нибудь рекомендации относительно того, как легко проверить, правильно ли установлена моя установка? Есть ли простые контрольные показатели скорости? Разница в скорости между моим ноутбуком и машиной gpu настолько драматична, что я ожидаю, что все будет неправильно настроено.