Я новичок в искры, и я хочу использовать групповое и уменьшить, чтобы найти следующее из CSV (одна строка от используемого):
Department, Designation, costToCompany, State
Sales, Trainee, 12000, UP
Sales, Lead, 32000, AP
Sales, Lead, 32000, LA
Sales, Lead, 32000, TN
Sales, Lead, 32000, AP
Sales, Lead, 32000, TN
Sales, Lead, 32000, LA
Sales, Lead, 32000, LA
Marketing, Associate, 18000, TN
Marketing, Associate, 18000, TN
HR, Manager, 58000, TN
Я хотел бы упростить о CSV с группой Отдел, Назначение, Состояние с дополнительными столбцами с sum (costToCompany) и TotalEmployeeCount
Должен получить результат вроде:
Dept, Desg, state, empCount, totalCost
Sales,Lead,AP,2,64000
Sales,Lead,LA,3,96000
Sales,Lead,TN,2,64000
Есть ли способ достичь этого с помощью преобразований и действий. Или мы должны идти на операции RDD?