Я пытаюсь запустить граф тензорного потока для обучения модели и периодически оценивать с использованием отдельного набора данных оценки. Данные обучения и оценки реализуются с использованием бегунов очереди.
Мое текущее решение состоит в том, чтобы создать оба входа в одном графике и использовать tf.cond
в зависимости от заполнитель is_training
. Моя проблема выделена следующим кодом:
import tensorflow as tf
from tensorflow.models.image.cifar10 import cifar10
from time import time
def get_train_inputs(is_training):
return cifar10.inputs(False)
def get_eval_inputs(is_training):
return cifar10.inputs(True)
def get_mixed_inputs(is_training):
train_inputs = get_train_inputs(None)
eval_inputs = get_eval_inputs(None)
return tf.cond(is_training, lambda: train_inputs, lambda: eval_inputs)
def time_inputs(inputs_fn, n_runs=10):
graph = tf.Graph()
with graph.as_default():
is_training = tf.placeholder(dtype=tf.bool, shape=(),
name='is_training')
images, labels = inputs_fn(is_training)
with tf.Session(graph=graph) as sess:
coordinator = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=sess, coord=coordinator)
t = time()
for i in range(n_runs):
im, l = sess.run([images, labels], feed_dict={is_training: True})
dt = time() - t
coordinator.request_stop()
coordinator.join(threads)
return dt / n_runs
print('Train inputs: %.3f' % time_inputs(get_train_inputs))
print('Eval inputs: %.3f' % time_inputs(get_eval_inputs))
print('Mixed inputs: %.3f' % time_inputs(get_mixed_inputs))
Мне также пришлось прокомментировать строку image_summary
133
tensorflow/models/image/cifar10/cifar10_inputs.py
.
Это дало следующие результаты:
Train inputs: 0.055
Eval inputs: 0.050
Mixed inputs: 0.105
Казалось бы, в смешанном случае оба входа считываются/анализируются, хотя используется только 1. Есть ли способ избежать этого избыточного вычисления? Или есть более удобный способ переключения между данными обучения/оценки, которые все еще используют настройку очереди?