Спарк научно-исследовательская работа прописал новую распределенную модель программирования над классическим Hadoop MapReduce, утверждая, что упрощение и огромный прирост производительности во многих случаях, специально на машинном обучении. Тем не менее, материал для раскрытия internal mechanics
на Resilient Distributed Datasets
с Directed Acyclic Graph
, как представляется, отсутствует в этой статье.
Должно ли это лучше узнать, исследуя исходный код?