Мне часто приходится применять функцию к группам очень большого DataFrame (смешанных типов данных) и хотел бы использовать несколько ядер.
Я могу создать итератор из групп и использовать модуль многопроцессорности, но он неэффективен, потому что каждую группу и результаты функции нужно мариновать для обмена сообщениями между процессами.
Есть ли способ избежать травления или даже полностью избежать копирования DataFrame? Похоже, что функции общей памяти модулей многопроцессорности ограничены массивами numpy. Есть ли другие варианты?
