У меня есть следующая схема для таблицы тегов:
CREATE TABLE tags (
    id integer NOT NULL,
    name character varying(255) NOT NULL,
    parent_id integer
);
Мне нужно построить запрос, чтобы вернуть следующую структуру (здесь представлен как yaml для удобочитаемости):
- name: Ciencia
  parent_id: 
  id: 7
  children:
  - name: Química
    parent_id: 7
    id: 9
    children: []
  - name: Biología
    parent_id: 7
    id: 8
    children:
    - name: Botánica
      parent_id: 8
      id: 19
      children: []
    - name: Etología
      parent_id: 8
      id: 18
      children: []
После некоторых проб и ошибок и поиска похожих вопросов в SO, я придумал этот запрос:
    WITH RECURSIVE tagtree AS (
      SELECT tags.name, tags.parent_id, tags.id, json '[]' children
      FROM tags
      WHERE NOT EXISTS (SELECT 1 FROM tags tt WHERE tt.parent_id = tags.id)
      UNION ALL
      SELECT (tags).name, (tags).parent_id, (tags).id, array_to_json(array_agg(tagtree)) children FROM (
        SELECT tags, tagtree
        FROM tagtree
        JOIN tags ON tagtree.parent_id = tags.id
      ) v
      GROUP BY v.tags
    )
    SELECT array_to_json(array_agg(tagtree)) json
    FROM tagtree
    WHERE parent_id IS NULL
Но он возвращает следующие результаты при преобразовании в yaml:
- name: Ciencia
  parent_id: 
  id: 7
  children:
  - name: Química
    parent_id: 7
    id: 9
    children: []
- name: Ciencia
  parent_id: 
  id: 7
  children:
  - name: Biología
    parent_id: 7
    id: 8
    children:
    - name: Botánica
      parent_id: 8
      id: 19
      children: []
    - name: Etología
      parent_id: 8
      id: 18
      children: []
Корень node дублируется. Я мог бы объединить результаты с ожидаемым результатом в моем коде приложения, но я чувствую, что я близко, и это может быть сделано al из PG.
Вот пример с SQL Fiddle: http://sqlfiddle.com/#!15/1846e/1/0
Ожидаемый результат: https://gist.github.com/maca/e7002eb10f36fcdbc51b
Фактический выход: https://gist.github.com/maca/78e84fb7c05ff23f07f4
