Мне часто приходится применять функцию к группам очень большого DataFrame
(смешанных типов данных) и хотел бы использовать несколько ядер.
Я могу создать итератор из групп и использовать модуль многопроцессорности, но он неэффективен, потому что каждую группу и результаты функции нужно мариновать для обмена сообщениями между процессами.
Есть ли способ избежать травления или даже полностью избежать копирования DataFrame
? Похоже, что функции общей памяти модулей многопроцессорности ограничены массивами numpy
. Есть ли другие варианты?