У меня действительно большой файл с примерно 15 миллионами записей. Каждая строка файла содержит одну строку (назовите ее).
Мне нужно найти дубликаты записей в файле с помощью java. Я попытался использовать хэш-карту и обнаружить повторяющиеся записи. По-видимому, этот подход бросает мне ошибку "java.lang.OutOfMemoryError: Java heap space".
Как я могу решить эту проблему?
Я думаю, что я мог бы увеличить кучу пространства и попробовать, но я хотел знать, есть ли более эффективные решения без необходимости изменять область кучи.