Как использовать tf.keras с bfloat16

Я пытаюсь заставить модель tf.keras работать на TPU, используя смешанную точность. Мне было интересно, как построить модель keras, используя смешанную точность bfloat16. Это как то так?

with tf.contrib.tpu.bfloat16_scope():
    inputs = tf.keras.layers.Input(shape=(2,), dtype=tf.bfloat16)
    logits = tf.keras.layers.Dense(2)(inputs)

logits = tf.cast(logits, tf.float32)
model = tf.keras.models.Model(inputs=inputs, outputs=logits)
model.compile(optimizer=tf.keras.optimizers.Adam(.001),
              loss='mean_absolute_error', metrics=[])

tpu_model = tf.contrib.tpu.keras_to_tpu_model(
        model,
        strategy=tf.contrib.tpu.TPUDistributionStrategy(
            tf.contrib.cluster_resolver.TPUClusterResolver(tpu='my_tpu_name')
        )
    )

Ответ 1

Вы можете построить модель Keras, используя bfloat16 Mixed Precision (вычисления float16 и переменные float32), используя код, показанный ниже.

tf.keras.mixed_precision.experimental.set_policy('infer_float32_vars')

model = tf.keras.Sequential([
    tf.keras.layers.Inputs(input_shape=(2, ), dtype=tf.float16),    
    tf.keras.layers.Lambda(lambda x: tf.cast(x, 'float32')),
    tf.keras.layers.Dense(10)])

model.compile(optimizer=tf.keras.optimizers.Adam(.001),
              loss='mean_absolute_error', metrics=[])

model.fit(.............)

После того как модель построена и обучена, мы можем сохранить модель, выполнив следующий шаг:

tf.keras.experimental.export_saved_model(model, path_to_save_model)

Мы можем загрузить сохраненную модель Keras смешанной точности, используя следующий код:

new_model = tf.keras.experimental.load_from_saved_model(path_to_save_model)
new_model.summary()

Если вы считаете этот ответ полезным, примите этот ответ и/или проголосуйте за него. Благодарю.