Иерархическая/древовидная база данных для пути каталогов в файловой системе

Я хочу сохранить каталоги (представленные на диске) в базе данных, сохраняя их иерархическую/древовидную структуру.

Вот фигура:

                         (ROOT)
                       /        \ 
                    Dir2        Dir3
                   /    \           \
                 Dir4   Dir5        Dir6
                 /          
               Dir7

Я использую базу данных SQLite.

Пожалуйста, предложите мне:

  1. SQL-запрос для хранения вышеуказанной структуры в базе данных SQLite и

  2. запрос для получения полного пути к каталогу, когда я выбираю один.

    то есть предположим, что я выбрал Dir7, тогда я должен получить полный путь, как ROOT/Dir2/Dir4/Dir7

Ответ 1

Вот пример таблицы быстрого закрытия для SQLite. Я не включил операторы для вставки элементов в существующее дерево. Вместо этого я просто создал операторы вручную. Вы можете найти операторы вставки и удаления в Модели для иерархических данных слайды.

Ради моего здравомыслия, вставляя идентификаторы для каталогов, я переименовал каталоги в соответствии с их идентификаторами:

        (ROOT)
      /        \ 
    Dir2        Dir3
    /    \           \
  Dir4   Dir5        Dir6
  /          
Dir7

Создание таблиц

CREATE TABLE 'filesystem' (
  'id' INTEGER,
  'dirname' TEXT,
  PRIMARY KEY ('id')
);

CREATE TABLE 'tree_path' (
  'ancestor' INTEGER,
  'descendant' INTEGER,
  PRIMARY KEY ('ancestor', 'descendant')
);

Вставьте каталоги в таблицу filesystem

INSERT INTO filesystem (id, dirname) VALUES (1, 'ROOT');
INSERT INTO filesystem (id, dirname) VALUES (2, 'Dir2');
INSERT INTO filesystem (id, dirname) VALUES (3, 'Dir3');
INSERT INTO filesystem (id, dirname) VALUES (4, 'Dir4');
INSERT INTO filesystem (id, dirname) VALUES (5, 'Dir5');
INSERT INTO filesystem (id, dirname) VALUES (6, 'Dir6');
INSERT INTO filesystem (id, dirname) VALUES (7, 'Dir7');

Создание путей к таблице замыкания

INSERT INTO tree_path (ancestor, descendant) VALUES (1, 1);
INSERT INTO tree_path (ancestor, descendant) VALUES (1, 2);
INSERT INTO tree_path (ancestor, descendant) VALUES (1, 3);
INSERT INTO tree_path (ancestor, descendant) VALUES (1, 4);
INSERT INTO tree_path (ancestor, descendant) VALUES (1, 5);
INSERT INTO tree_path (ancestor, descendant) VALUES (1, 6);
INSERT INTO tree_path (ancestor, descendant) VALUES (1, 7);
INSERT INTO tree_path (ancestor, descendant) VALUES (2, 2);
INSERT INTO tree_path (ancestor, descendant) VALUES (2, 4);
INSERT INTO tree_path (ancestor, descendant) VALUES (2, 5);
INSERT INTO tree_path (ancestor, descendant) VALUES (2, 7);
INSERT INTO tree_path (ancestor, descendant) VALUES (3, 3);
INSERT INTO tree_path (ancestor, descendant) VALUES (3, 6);
INSERT INTO tree_path (ancestor, descendant) VALUES (4, 4);
INSERT INTO tree_path (ancestor, descendant) VALUES (4, 7);
INSERT INTO tree_path (ancestor, descendant) VALUES (5, 5);
INSERT INTO tree_path (ancestor, descendant) VALUES (6, 6);
INSERT INTO tree_path (ancestor, descendant) VALUES (7, 7);

Выполнить несколько запросов

# (ROOT) and subdirectories
SELECT f.id, f.dirname FROM filesystem f
  JOIN tree_path t
    ON t.descendant = f.id
 WHERE t.ancestor = 1;

+----+---------+
| id | dirname |
+----+---------+
|  1 | ROOT    |
|  2 | Dir2    |
|  3 | Dir3    |
|  4 | Dir4    |
|  5 | Dir5    |
|  6 | Dir6    |
|  7 | Dir7    |
+----+---------+


# Dir3 and subdirectories
SELECT f.id, f.dirname
  FROM filesystem f
  JOIN tree_path t
    ON t.descendant = f.id
 WHERE t.ancestor = 3;

+----+---------+
| id | dirname |
+----+---------+
|  3 | Dir3    |
|  6 | Dir6    |
+----+---------+

# Dir5 and parent directories
SELECT f.id, f.dirname
  FROM filesystem f
  JOIN tree_path t
    ON t.ancestor = f.id
 WHERE t.descendant = 5;

+----+---------+
| id | dirname |
+----+---------+
|  1 | ROOT    |
|  2 | Dir2    |
|  5 | Dir5    |
+----+---------+

# Dir7 and parent directories
SELECT f.id, f.dirname
  FROM filesystem f
  JOIN tree_path t
    ON t.ancestor = f.id
 WHERE t.descendant = 7;

+----+---------+
| id | dirname |
+----+---------+
|  1 | ROOT    |
|  2 | Dir2    |
|  4 | Dir4    |
|  7 | Dir7    |
+----+---------+

SELECT f.id, f.dirname
  FROM filesystem f
  JOIN tree_path t
    ON t.ancestor = f.id
 WHERE t.descendant = (
SELECT id
  FROM filesystem
 WHERE dirname LIKE '%7%'
);

+----+---------+
| id | dirname |
+----+---------+
|  1 | ROOT    |
|  2 | Dir2    |
|  4 | Dir4    |
|  7 | Dir7    |
+----+---------+

Ответ 2

Вы представляете иерархические данные как ряд узлов, каждый из которых имеет идентификатор и родительский идентификатор. Вы можете сохранить его в таблице под названием DIRTAB с двумя столбцами идентификатора и одной для текста имени отдельного каталога:

ID -- as a primary key  
PARENT_ID -- refers to the ID of the parent row in DIRTAB  
DIRNAME -- the text of the name eg Dir5  

В SQLite отсутствует предложение CONNECT BY, что Oracle должен обрабатывать иерархические данные, но я думаю, что если вы готовы принять какой-то уродливый SQL, вы можете приблизить что-то иерархическое:

SELECT (CASE WHEN p5.DIRNAME IS NOT NULL THEN p5.DIRNAME || '/' ELSE '' END) ||
       (CASE WHEN p4.DIRNAME IS NOT NULL THEN p4.DIRNAME || '/' ELSE '' END) ||
       (CASE WHEN p3.DIRNAME IS NOT NULL THEN p3.DIRNAME || '/' ELSE '' END) ||
       (CASE WHEN p2.DIRNAME IS NOT NULL THEN p2.DIRNAME || '/' ELSE '' END) ||
       (CASE WHEN p1.DIRNAME IS NOT NULL THEN p1.DIRNAME || '/' ELSE '' END) ||
       p0.DIRNAME as FULLPATH
FROM DIRTAB p0
     LEFT OUTER JOIN DIRTAB p1 ON p1.ID = p0.PARENT_ID
     LEFT OUTER JOIN DIRTAB p2 ON p2.ID = p1.PARENT_ID
     LEFT OUTER JOIN DIRTAB p3 ON p3.ID = p2.PARENT_ID
     LEFT OUTER JOIN DIRTAB p4 ON p4.ID = p3.PARENT_ID
     LEFT OUTER JOIN DIRTAB p5 ON p5.ID = p4.PARENT_ID
WHERE p0.DIRNAME = 'Dir6'  

Проблема заключается в том, что вы должны предвидеть максимальную глубину своей структуры каталогов и развернуть инструкцию SQL для справки. В качестве примера я сделал 6 уровней.
Также я предполагаю, что SQLite не имеет проблем с конкатенированием пустых строк. (Некоторые DB обрабатывают их как null и преобразовывают результат всего выражения в null)

Ответ 3

Я думаю, вы должны прочитать о методе Измененный обход дерева заказов: http://www.sitepoint.com/hierarchical-data-database/

В этой связи обсуждаются два метода хранения иерархических данных в реляционных базах данных: модель списка смежности и измененный алгоритм обхода дерева предзаказов.

Основная идея метода обхода дерева с измененным предзаказом - аннотировать все узлы с указателями для выбора навигации и поддерева: введите описание изображения здесь