Postgres: выберите все строки с количеством полей больше 1

У меня есть таблица хранения информации о ценах на продукт, таблица похожа на (нет первичного ключа)

no   name    price    date
1    paper   1.99     3-23
2    paper   2.99     5-25
3    paper   1.99     5-29
4    orange  4.56     4-23
5    apple   3.43     3-11

прямо сейчас я хочу выбрать все строки, в которых поле "name" появилось более одного раза в таблице. В принципе, я хочу, чтобы мой запрос возвращал первые три строки.

Я пытался:

SELECT * FROM product_price_info GROUP BY name HAVING COUNT(*) > 1

но я получаю сообщение об ошибке:

столбец "product_price_info.no" должен появиться в предложении GROUP BY или использоваться в агрегатной функции

Ответ 1

SELECT * 
FROM product_price_info 
WHERE name IN (SELECT name 
               FROM product_price_info 
               GROUP BY name HAVING COUNT(*) > 1)

Ответ 2

Попробуй это:

SELECT no, name, price, "date"
FROM (
  SELECT no, name, price, "date",
         COUNT(*) OVER (PARTITION BY name) AS cnt 
  FROM product_price_info ) AS t
WHERE t.cnt > 1

Вы можете использовать оконную версию COUNT для получения совокупности каждого раздела name. Затем во внешнем запросе отфильтровывайте разделы name с населением, которое меньше 2.

Ответ 3

Функции окна действительно хороши для этого.

SELECT p.*, count(*) OVER (PARTITION BY name) FROM product p;

Для полного примера:

CREATE TABLE product (no SERIAL, name text, price NUMERIC(8,2), date DATE);

INSERT INTO product(name, price, date) values
('paper', 1.99, '2017-03-23'),
('paper', 2.99, '2017-05-25'),
('paper', 1.99, '2017-05-29'),
('orange', 4.56, '2017-04-23'),
('apple', 3.43, '2017-03-11')
;

WITH report AS (
  SELECT p.*, count(*) OVER (PARTITION BY name) as count FROM product p
)
SELECT * FROM report WHERE count > 1;

дает:

 no |  name  | price |    date    | count
----+--------+-------+------------+-------
  1 | paper  |  1.99 | 2017-03-23 |     3
  2 | paper  |  2.99 | 2017-05-25 |     3
  3 | paper  |  1.99 | 2017-05-29 |     3
(3 rows)

Ответ 4

Self join version, используйте подзапрос, который возвращает имя, которое появляется более одного раза.

select t1.*
from tablename t1
join (select name from tablename group by name having count(*) > 1) t2
  on t1.name = t2.name

В основном такие же, как версии IN/EXISTS, но, вероятно, немного быстрее.