Как я могу использовать потоки Java 8 с InputStream?

Я хотел бы обернуть java.util.streams.Stream вокруг InputStream для обработки одного байта или одного символа за раз. Я не нашел простого способа сделать это.

Рассмотрим следующее упражнение: мы хотим подсчитать количество раз, когда каждая буква появляется в текстовом файле. Мы можем сохранить это в массиве, чтобы tally[0] сохранил количество раз, которое появляется в файле, tally[1] хранит количество времени b и т.д. Поскольку я не мог найти способ потоковой передачи файла напрямую, я сделал это:

 int[] tally = new int[26];
 Stream<String> lines = Files.lines(Path.get(aFile)).map(s -> s.toLowerCase());
 Consumer<String> charCount = new Consumer<String>() {
   public void accept(String t) {
      for(int i=0; i<t.length(); i++)
         if(Character.isLetter(t.charAt(i) )
            tall[t.charAt(i) - 'a' ]++;
   }
 };
 lines.forEach(charCount);

Есть ли способ выполнить это без использования метода lines? Могу ли я просто обрабатывать каждый символ напрямую как поток или поток вместо создания строк для каждой строки в текстовом файле.

Могу ли я более конкретно преобразовать java.io.InputStream в java.util.Stream.stream?

Ответ 1

Во-первых, вы должны переопределить свою задачу. Вы читаете символы, поэтому вы не хотите преобразовывать InputStream, а Reader в Stream.

Вы не можете повторно выполнить преобразование кодировки, которое происходит, например. в InputStreamReader, с операциями Stream, так как могут быть n: m отображений между byte InputStream и результирующими char s.

Создание потока из Reader немного сложнее. Вам понадобится итератор, чтобы указать способ получения элемента и конечное условие:

PrimitiveIterator.OfInt it=new PrimitiveIterator.OfInt() {
    int last=-2;
    public int nextInt() {
      if(last==-2 && !hasNext())
          throw new NoSuchElementException();
      try { return last; } finally { last=-2; }
    }
    public boolean hasNext() {
      if(last==-2)
        try { last=reader.read(); }
        catch(IOException ex) { throw new UncheckedIOException(ex); }
      return last>=0;
    }
};

После того, как у вас есть итератор, вы можете создать поток, используя обход spliterator и выполнить требуемую операцию:

int[] tally = new int[26];
StreamSupport.intStream(Spliterators.spliteratorUnknownSize(
  it, Spliterator.ORDERED | Spliterator.IMMUTABLE | Spliterator.NONNULL), false)
// now you have your stream and you can operate on it:
  .map(Character::toLowerCase)
  .filter(c -> c>='a'&&c<='z')
  .map(c -> c-'a')
  .forEach(i -> tally[i]++);

Обратите внимание, что в то время как итераторы более знакомы, реализация нового интерфейса Spliterator упрощает операцию, так как она не требует сохранения состояния между двумя методами, которые можно было бы вызвать в произвольном порядке. Вместо этого у нас есть только один метод tryAdvance, который можно сопоставить непосредственно с вызовом read():

Spliterator.OfInt sp = new Spliterators.AbstractIntSpliterator(1000L,
    Spliterator.ORDERED | Spliterator.IMMUTABLE | Spliterator.NONNULL) {
        public boolean tryAdvance(IntConsumer action) {
            int ch;
            try { ch=reader.read(); }
            catch(IOException ex) { throw new UncheckedIOException(ex); }
            if(ch<0) return false;
            action.accept(ch);
            return true;
        }
    };
StreamSupport.intStream(sp, false)
// now you have your stream and you can operate on it:
…

Однако обратите внимание, что если вы передумаете и захотите использовать Files.lines, вам может быть намного легче:

int[] tally = new int[26];
Files.lines(Paths.get(file))
  .flatMapToInt(CharSequence::chars)
  .map(Character::toLowerCase)
  .filter(c -> c>='a'&&c<='z')
  .map(c -> c-'a')
  .forEach(i -> tally[i]++);