В каркасе MapReduce один редуктор используется для каждого ключа, сгенерированного преобразователем.
Итак, вы думаете, что указание количества редукторов в Hadoop MapReduce не имеет никакого смысла, потому что оно зависит от программы. Однако Hadoop позволяет указать количество используемых редукторов (-D mapred.reduce.tasks = # редукторов).
Что это значит? Является ли значение параметра для числа редукторов, определяющее, сколько машинных ресурсов переходит на редукторы вместо количества используемых фактических редукторов?