Как выбрать самые новые четыре позиции для каждой категории?

У меня есть база данных элементов. Каждый элемент классифицируется с идентификатором категории из таблицы категорий. Я пытаюсь создать страницу, в которой перечислены все категории, и под каждой категорией я хочу показать 4 новых элемента в этой категории.

Пример:

Принадлежности для домашних животных

img1
img2
img3
img4

Корм ​​для домашних животных

img1
img2
img3
img4

Я знаю, что я мог бы легко решить эту проблему, запросив базу данных для каждой категории следующим образом:

SELECT id FROM category

Затем повторить эти данные и запросить базу данных для каждой категории, чтобы захватить новейшие элементы:

SELECT image FROM item where category_id = :category_id 
ORDER BY date_listed DESC LIMIT 4

Я пытаюсь выяснить, могу ли я просто использовать 1 запрос и захватить все эти данные. У меня 33 категории, поэтому я подумал, что это может помочь уменьшить количество вызовов в базе данных.

Кто-нибудь знает, возможно ли это? Или, если 33 звонка не так важны, и я должен просто сделать это легко.

Ответ 1

Это самая большая проблема с n-группой, и это очень распространенный вопрос SQL.

Вот как я решаю его с помощью внешних соединений:

SELECT i1.*
FROM item i1
LEFT OUTER JOIN item i2
  ON (i1.category_id = i2.category_id AND i1.item_id < i2.item_id)
GROUP BY i1.item_id
HAVING COUNT(*) < 4
ORDER BY category_id, date_listed;

Я предполагаю, что основным ключом таблицы item является item_id, и что это монотонно возрастающее псевдокод. То есть большее значение в item_id соответствует более новой строке в item.

Здесь, как это работает: для каждого элемента есть несколько других элементов, которые новее. Например, есть три элемента новее, чем четвертый новый элемент. Есть ноль, новее, чем самый новый элемент. Поэтому мы хотим сравнить каждый элемент (i1) с набором элементов (i2), которые новее и имеют ту же категорию, что и i1. Если число этих новых элементов меньше четырех, i1 является одним из тех, которые мы включаем. В противном случае не включайте его.

Красота этого решения заключается в том, что он работает независимо от того, сколько у вас категорий, и продолжает работать, если вы меняете категории. Он также работает, даже если количество элементов в некоторых категориях меньше четырех.


Другое решение, которое работает, но использует функцию пользовательских переменных MySQL:

SELECT *
FROM (
    SELECT i.*, @r := IF(@g = category_id, @r+1, 1) AS rownum, @g := category_id
    FROM (@g:=null, @r:=0) AS _init
    CROSS JOIN item i
    ORDER BY i.category_id, i.date_listed
) AS t
WHERE t.rownum <= 3;

В MySQL 8.0.3 появилась поддержка стандартных оконных функций SQL. Теперь мы можем решить такую ​​проблему, как это делают другие РСУБД:

WITH numbered_item AS (
  SELECT *, ROW_NUMBER() OVER (PARTITION BY category_id ORDER BY item_id) AS rownum
  FROM item
)
SELECT * FROM numbered_item WHERE rownum <= 4;

Ответ 2

Это решение является адаптацией из другого SO-решения, спасибо RageZ за поиск этого связанного/подобного вопроса.

Примечание

Это решение кажется удовлетворительным для случая использования Джастина. В зависимости от вашего варианта использования вы можете проверить решения Bill Karwin или David Andres в этой публикации. Решение Билла имеет мой голос! Посмотрите, почему, поскольку я поставил оба вопроса рядом друг с другом, -)

Преимущество моего решения состоит в том, что он возвращает одну запись для категории_ид (информация из таблицы элементов "свернута" ). Основным недостатком моего решения является отсутствие читаемости и растущая сложность, так как количество желаемых строк растет (скажем, 6 строк для каждой категории, а не 6). Кроме того, это может быть немного медленнее по мере роста количества строк в таблице элементов. (Независимо от того, что все решения будут лучше работать с меньшим количеством допустимых строк в таблице элементов, и поэтому рекомендуется либо периодически удалять, либо перемещать старые элементы и/или вводить флаг, чтобы помочь SQL отфильтровать строки раньше)

Первая попытка (не работает!!!)...

Проблема с этим подходом заключалась в том, что подзапрос [по праву, но плохой для нас] производит очень много строк, основанных на декартовых произведениях, определенных самим собой.

SELECT id, CategoryName(?), tblFourImages.*
FROM category
JOIN (
    SELECT i1.category_id, i1.image as Image1, i2.image AS Image2, i3.image AS Image3, i4.image AS Image4
    FROM item AS i1
    LEFT JOIN item AS i2 ON i1.category_id = i2.category_id AND i1.date_listed > i2.date_listed
    LEFT JOIN item AS i3 ON i2.category_id = i3.category_id AND i2.date_listed > i3.date_listed
    LEFT JOIN item AS i4 ON i3.category_id = i4.category_id AND i3.date_listed > i4.date_listed
) AS tblFourImages ON tblFourImages.category_id = category.id
--WHERE  here_some_addtional l criteria if needed
ORDER BY id ASC;

Вторая попытка. (работает нормально!)

Предложение WHERE в добавлении для подзапроса, заставляющее указанную дату быть последней, второй, последней и т.д. для i1, i2, i3 и т.д., соответственно (а также допускать нулевые случаи, когда их меньше 4 элемента для идентификатора определенной категории). Кроме того, были добавлены несвязанные предложения фильтра, чтобы запретить показ записей, которые "проданы" или записи, которые не имеют изображения (добавленные требования)

Эта логика делает предположение о том, что не существует повторяющихся значений, указанных в дате (для данной категории_id). В противном случае такие случаи создавали бы повторяющиеся строки. Эффективно это использование указанной даты - это монотонно увеличенный первичный ключ, как определено/требуется в решении Билла.

SELECT id, CategoryName, tblFourImages.*
FROM category
JOIN (
    SELECT i1.category_id, i1.image as Image1, i2.image AS Image2, i3.image AS Image3, i4.image AS Image4, i4.date_listed
    FROM item AS i1
    LEFT JOIN item AS i2 ON i1.category_id = i2.category_id AND i1.date_listed > i2.date_listed AND i2.sold = FALSE AND i2.image IS NOT NULL
          AND i1.sold = FALSE AND i1.image IS NOT NULL
    LEFT JOIN item AS i3 ON i2.category_id = i3.category_id AND i2.date_listed > i3.date_listed AND i3.sold = FALSE AND i3.image IS NOT NULL
    LEFT JOIN item AS i4 ON i3.category_id = i4.category_id AND i3.date_listed > i4.date_listed AND i4.sold = FALSE AND i4.image IS NOT NULL
    WHERE NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i1.date_listed)
      AND (i2.image IS NULL OR (NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i2.date_listed AND date_listed <> i1.date_listed)))
      AND (i3.image IS NULL OR (NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i3.date_listed AND date_listed <> i1.date_listed AND date_listed <> i2.date_listed)))
      AND (i4.image IS NULL OR (NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i4.date_listed AND date_listed <> i1.date_listed AND date_listed <> i2.date_listed AND date_listed <> i3.date_listed)))
) AS tblFourImages ON tblFourImages.category_id = category.id
--WHERE  --
ORDER BY id ASC;

Теперь... сравните следующее, когда я представляю ключ item_id и использую решение Билла, чтобы предоставить их список "внешнему" запросу. Вы можете понять, почему подход Билла лучше...

SELECT id, CategoryName, image, date_listed, item_id
FROM item I
LEFT OUTER JOIN category C ON C.id = I.category_id
WHERE I.item_id IN 
(
SELECT i1.item_id
FROM item i1
LEFT OUTER JOIN item i2
  ON (i1.category_id = i2.category_id AND i1.item_id < i2.item_id
      AND i1.sold = 'N' AND i2.sold = 'N'
      AND i1.image <> '' AND i2.image <> ''
      )
GROUP BY i1.item_id
HAVING COUNT(*) < 4
)
ORDER BY category_id, item_id DESC

Ответ 3

В других базах данных вы можете сделать это с помощью функции ROW_NUMBER.

SELECT
    category_id, image, date_listed
FROM
(
    SELECT
        category_id, image, date_listed,
        ROW_NUMBER() OVER (PARTITION BY category_id
                           ORDER BY date_listed DESC) AS rn
    FROM item
) AS T1
WHERE rn <= 4

К сожалению, MySQL не поддерживает функцию ROW_NUMBER, но вы можете эмулировать ее с помощью переменных:

SELECT
    category_id, image, date_listed
FROM
(
    SELECT
        category_id, image, date_listed,
        @rn := IF(@prev = category_id, @rn + 1, 1) AS rn,
        @prev := category_id
    FROM item
    JOIN (SELECT @prev := NULL, @rn = 0) AS vars
    ORDER BY category_id, date_listed DESC
) AS T1
WHERE rn <= 4

Посмотрите, как он работает в Интернете: sqlfiddle

Он работает следующим образом:

  • Внутри @prev установлено значение NULL, а @rn - 0.
  • Для каждой строки, которую мы видим, проверьте, совпадает ли category_id с предыдущей строкой.
    • Если да, увеличьте номер строки.
    • В противном случае запустите новую категорию и reset номер строки, чтобы вернуться к 1.
  • Когда подзапрос завершается, последним шагом является фильтрация, так что сохраняются только строки с номером строки, меньшим или равным 4.

Ответ 4

не очень красиво, но:

SELECT image 
FROM item 
WHERE date_listed IN (SELECT date_listed 
                      FROM item 
                      ORDER BY date_listed DESC LIMIT 4)

Ответ 5

В зависимости от того, насколько постоянны ваши категории, следующий простейший маршрут

SELECT C.CategoryName, R.Image, R.date_listed
FROM
(
    SELECT CategoryId, Image, date_listed
    FROM 
    (
      SELECT CategoryId, Image, date_listed
      FROM item
      WHERE Category = 'Pet Supplies'
      ORDER BY date_listed DESC LIMIT 4
    ) T

    UNION ALL

    SELECT CategoryId, Image, date_listed
    FROM
    (        
      SELECT CategoryId, Image, date_listed
      FROM item
      WHERE Category = 'Pet Food'
      ORDER BY date_listed DESC LIMIT 4
    ) T
) RecentItemImages R
INNER JOIN Categories C ON C.CategoryId = R.CategoryId
ORDER BY C.CategoryName, R.Image, R.date_listed

Ответ 6

приведенный ниже код показывает способ сделать это в цикле он определенно нуждается в большом редактировании, но я надеюсь, что это поможет.

        declare @RowId int
 declare @CategoryId int
        declare @CategoryName varchar(MAX)

 create table PART (RowId int, CategoryId int, CategoryName varchar)
 create table  NEWESTFOUR(RowId int, CategoryId int, CategoryName varchar, Image image)
        select RowId = ROW_NUMBER(),CategoryId,CategoryName into PART from [Category Table]


        set @PartId = 0
 set @CategoryId = 0 
 while @Part_Id <= --count
 begin
   set @PartId = @PartId + 1
          SELECT @CategoryId = category_id, @CategoryName = category_name from PART where PartId = @Part_Id
          SELECT RowId = @PartId, image,CategoryId = @category_id, CategoryName = @category_name   FROM item into NEWESTFOUR where category_id = :category_id 
ORDER BY date_listed DESC LIMIT 4

 end
 select * from NEWESTFOUR
 drop table NEWESTFOUR
        drop table PART

Ответ 7

ok после того, как поисковый запрос быстрого ответа невозможен, по крайней мере, на mysql

этот поток для справки

возможно, вам следует кэшировать результат этого запроса, если вы боитесь свалить сервер и хотите, чтобы код работал более хорошо.