Я ищу способ научиться быть с большими наборами данных. Я студент университета, поэтому все, что я делаю, имеет "хороший" размер и сложность. Работая над исследовательским проектом с профессором в этом семестре, мне пришлось визуализировать отношения между несколькими большими (по моему опыту) набором данных. Это был файл CSV размером 15 МБ.
Я написал большую часть своих данных в Python, которые визуализируются с использованием GNUPlot.
Есть ли доступные книги или веб-сайты по этому вопросу? Бонусные баллы за использование Python, больше бонусных очков за более "базовую" систему визуализации, чем полагаться на gnuplot. Каир или что-то еще, я полагаю.
Ищете что-то, что берет меня от интеллектуального анализа данных, обработки, визуализации.
EDIT: Я больше ищу что-то, что научит меня "большим идеям". Я могу написать код сам, но ищу методы, которые люди используют для обработки больших наборов данных. Я имею в виду, что мой 15 МБ достаточно мал, и я могу поместить все, что мне когда-либо понадобится, в память и просто начать хруст. Что делают люди для визуализации наборов данных на 5 ГБ?