Я прочитал документацию HashPartitioner
. К сожалению, ничего особо не объяснялось, кроме вызовов API. Я полагаю, что HashPartitioner
разделяет распределенный набор на основе хэша ключей. Например, если мои данные похожи на
(1,1), (1,2), (1,3), (2,1), (2,2), (2,3)
Таким образом, обозреватель поместил бы это в разные разделы с одинаковыми ключами, входящими в один раздел. Однако я не понимаю значения аргумента конструктора
new HashPartitoner(numPartitions) //What does numPartitions do?
Для вышеуказанного набора данных, как бы результаты отличались, если бы я сделал
new HashPartitoner(1)
new HashPartitoner(2)
new HashPartitoner(10)
Итак, как работает HashPartitioner
?