Запуск модели из коробки генерирует эти файлы в каталоге данных:
ls
dev-v2.tgz newstest2013.en
giga-fren.release2.fixed.en newstest2013.en.ids40000
giga-fren.release2.fixed.en.gz newstest2013.fr
giga-fren.release2.fixed.en.ids40000 newstest2013.fr.ids40000
giga-fren.release2.fixed.fr training-giga-fren.tar
giga-fren.release2.fixed.fr.gz vocab40000.from
giga-fren.release2.fixed.fr.ids40000 vocab40000.to
Чтение src translate.py:
https://github.com/tensorflow/models/blob/master/tutorials/rnn/translate/translate.py
tf.app.flags.DEFINE_string("from_train_data", None, "Training data.")
tf.app.flags.DEFINE_string("to_train_data", None, "Training data.")
Чтобы использовать мои собственные данные обучения, я создал данные, полученные от моих поездок и данных поездок, и добавьте свои собственные данные обучения в каждый из этих каналов, данные обучения содержатся в файлах mydata.from и mydata.to
my-to-train-data contains mydata.from
my-from-train-data contains mydata.to
Я не мог найти документацию о том, как использовать собственные данные обучения или какой формат он должен принять, поэтому я сделал вывод об этом из файла translate.py src и содержимого dir данных, созданного при выполнении перевода модели из коробки.
Содержание mydata.from:
Is this a question
Содержание mydata.to:
Yes!
Затем я пытаюсь обучить модель, используя:
python translate.py --from_train_data my-from-train-data --to_train_data my-to-train-data
Возврат с ошибкой:
tensorflow.python.framework.errors_impl.NotFoundError: my-from-train-data.ids40000
Появляется, мне нужно создать файл my-from-train-data.ids40000, что это должно быть? Есть ли пример того, как обучать эту модель с помощью пользовательских данных?