Спарк научно-исследовательская работа прописал новую распределенную модель программирования над классическим Hadoop MapReduce, утверждая, что упрощение и огромный прирост производительности во многих случаях, специально на машинном обучении. Тем не менее, материал для раскрытия internal mechanics на Resilient Distributed Datasets с Directed Acyclic Graph, как представляется, отсутствует в этой статье.
Должно ли это лучше узнать, исследуя исходный код?


