Самый чистый способ индексирования коллекции по свойству элемента, который сам является коллекцией

У меня есть List<Foo> и хочу guava Multimap<String, Foo>, где мы сгруппировали Foo по каждому тегу их функции Collection<String> getTags().

Я использую java 8, поэтому ссылки lambdas и методы хорошо/рекомендуется.

Например, если у меня есть:

foo1, tags=a,b,c
foo2, tags=c,d
foo3, tags=a,c,e

Я получил бы Multimap<String, Foo> с:

a -> foo1, foo3
b -> foo1
c -> foo1, foo2, foo3
d -> foo2
e -> foo3

Ответ 1

Для этого вы можете использовать пользовательский сборщик:

Multimap<String, Foo> map = list.stream().collect(
    ImmutableMultimap::builder,
    (builder, value) -> value.getTags().forEach(tag -> builder.put(tag, value)),
    (builder1, builder2) -> builder1.putAll(builder2.build())
).build();

Это не вызывает дополнительных побочных эффектов (см. здесь об этом), является параллельным и более идиоматичным.

Вы также можете извлечь эти специальные ягненки в полноценный коллекционер, что-то вроде этого:

public static <T, K> Collector<T, ?, Multimap<K, T>> toMultimapByKey(Function<? super T, ? extends Iterable<? extends K>> keysMapper) {
    return new MultimapCollector<>(keysMapper);
}

private static class MultimapCollector<T, K> implements Collector<T, ImmutableMultimap.Builder<K, T>, Multimap<K, T>> {
    private final Function<? super T, ? extends Iterable<? extends K>> keysMapper;

    private MultimapCollector(Function<? super T, ? extends Iterable<? extends K>> keysMapper) {
        this.keysMapper = keysMapper;
    }

    @Override
    public Supplier<ImmutableMultimap.Builder<K, T>> supplier() {
        return ImmutableMultimap::builder;
    }

    @Override
    public BiConsumer<ImmutableMultimap.Builder<K, T>, T> accumulator() {
        return (builder, value) -> keysMapper.apply(value).forEach(k -> builder.put(k, value));
    }

    @Override
    public BinaryOperator<ImmutableMultimap.Builder<K, T>> combiner() {
        return (b1, b2) -> b1.putAll(b2.build());
    }

    @Override
    public Function<ImmutableMultimap.Builder<K, T>, Multimap<K, T>> finisher() {
        return ImmutableMultimap.Builder<K, T>::build;
    }

    @Override
    public Set<Characteristics> characteristics() {
        return Collections.emptySet();
    }
}

Тогда коллекция будет выглядеть так:

Multimap<String, Foo> map = list.stream().collect(toMultimapByKey(Foo::getTags));

Вы также можете вернуть метод EnumSet.of(Characteristics.UNORDERED) из characteristics(), если заказ не важен для вас. Это может привести к более эффективному использованию механизмов внутренней сборки, особенно в случае параллельного сокращения.

Ответ 2

ImmutableMultimap.Builder<String, Foo> builder = ImmutableMultimap.builder();
list.forEach(foo -> foo.getTags().forEach(tag -> builder.put(tag, foo));
return builder.build();

Ответ 3

Это немного более идиоматично для потоков Java 8:

    Multimap<String, Foo> map = list.stream()
            //First build a stream of Pair<String, Foo>
            .flatMap(f -> f.tags.stream().map(s -> new AbstractMap.SimpleImmutableEntry<>(s, f)))
            //Then collect it up into a multimap.
            .collect(
                    Multimaps.toMultimap(
                            x -> x.getKey(),
                            x -> x.getValue(),
                            MultimapBuilder.hashKeys().arrayListValues()::build
                    )
            );

Я знаю, что использование парного класса довольно уродливо, но я хотел бы показать ключевую вещь - коллекционер Multimaps.toMultmap. Там также Multmaps.flatteningToMultimap для других случаев использования.