В выходном слое нейронной сети типично использовать функцию softmax для аппроксимации распределения вероятности:
Это дорого вычисляется из-за экспонентов. Почему бы просто не выполнить преобразование Z так, чтобы все выходы были положительными, а затем нормализовались просто делением всех выходов на сумму всех выходов?