Итак, проведя пару дней, вспоминая, как кодировать все виды инструментов Unix, таких как sed, awk и grep, изучая пару относительно новых, таких как завиток (я знаю, правильно? Я даже вырываю gcc для первый раз, возможно, через 20 лет, но все это быстро возвращается) и добились значительного прогресса в создании небольшой JSON DB для использования с Elasticsearch на AWS EC2.
Но я просто попал в проблему с массовой индексацией, поскольку конечная точка ES _bulk требует, чтобы файлы были в основном последовательными строками JSON с \n терминаторами для каждой строки; и то, что я создал с использованием различных веб-API, и предварительная обработка файлов - это довольно JSON, то есть легко читаемый человеком.
Есть ли простой метод оболочки script, чтобы весь симпатичный JSON просто конкатенировался в строки, не загружая некоторые библиотеки Java или что-то еще? Я могу добавить токены к основному файлу во время предварительной обработки, чтобы пометить нужные \n перерывы, если это поможет разобрать, но если у кого-нибудь есть подсказка на наборе инструментов, я был бы благодарен, поскольку я - это маленький шаг от присоединения к концам проект. У меня есть ощущение, что там есть скрипты, и я знаю, что есть несколько библиотек, но я пока не нашел простых инструментов командной строки, чтобы сделать незаметную печать.
Большое спасибо за любые советы,
Приветствия
Сид