Скажем, я использую довольно стандартный 32-значный шестнадцатеричный GUID, и я решил, что, поскольку он случайно генерируется для моих пользователей, он идеально подходит для использования в качестве ключа осколка в горизонтальном масштабе для записи в коллекцию MongoDB, в которой я буду хранить информацию о пользователе (и масштабирование записи является моей основной задачей).
Я также знаю, что мне нужно будет начать с как минимум 4 осколков, из-за прогнозов трафика и некоторой контрольной работы, выполненной с тестовой средой.
Наконец, у меня есть достойное представление о моем первоначальном размере данных (средний размер документа * количество начальных пользователей) - около 120 ГБ.
Я хочу сделать начальную загрузку красивой и быстрой и использовать все 4 осколки как можно больше. Как предварительно разбить эти данные, чтобы я использовал 4 осколка и минимизировал количество ходов, разделов и т.д., Которые должны произойти на осколках во время начальной загрузки данных?