Как запросить как GROUP BY в django?

Я запрашиваю модель:

Members.objects.all()

И это возвращает:

Eric, Salesman, X-Shop
Freddie, Manager, X2-Shop
Teddy, Salesman, X2-Shop
Sean, Manager, X2-Shop

Я хочу знать, как лучше всего использовать Django для group_by запроса group_by в мою базу данных, например:

Members.objects.all().group_by('designation')

Который не работает, конечно. Я знаю, что мы можем сделать некоторые трюки с django/db/models/query.py, но мне просто интересно узнать, как это сделать без исправлений.

Ответ 1

Если вы хотите сделать агрегацию, вы можете использовать функции агрегации ORM:

from django.db.models import Count
Members.objects.values('designation').annotate(dcount=Count('designation'))

В результате возникает запрос, похожий на

SELECT designation, COUNT(designation) AS dcount
FROM members GROUP BY designation

и выход будет иметь вид

[{'designation': 'Salesman', 'dcount': 2}, 
 {'designation': 'Manager', 'dcount': 2}]

Ответ 2

Простое, но не правильное решение - использовать сырой SQL:

results = Members.objects.raw('SELECT * FROM myapp_members GROUP BY designation')

Другое решение заключается в использовании свойства group_by:

query = Members.objects.all().query
query.group_by = ['designation']
results = QuerySet(query=query, model=Members)

Теперь вы можете перебирать переменную результатов, чтобы получить ваши результаты. Обратите внимание, что group_by не задокументирована и может быть изменена в будущей версии Django.

И... почему вы хотите использовать group_by? Если вы не используете агрегацию, вы можете использовать order_by для достижения одинакового результата.

Ответ 3

Вы также можете использовать тег шаблона regroup для группировки по атрибутам. Из документов:

cities = [
    {'name': 'Mumbai', 'population': '19,000,000', 'country': 'India'},
    {'name': 'Calcutta', 'population': '15,000,000', 'country': 'India'},
    {'name': 'New York', 'population': '20,000,000', 'country': 'USA'},
    {'name': 'Chicago', 'population': '7,000,000', 'country': 'USA'},
    {'name': 'Tokyo', 'population': '33,000,000', 'country': 'Japan'},
]

...

{% regroup cities by country as country_list %}

<ul>
    {% for country in country_list %}
        <li>{{ country.grouper }}
            <ul>
            {% for city in country.list %}
                <li>{{ city.name }}: {{ city.population }}</li>
            {% endfor %}
            </ul>
        </li>
    {% endfor %}
</ul>

Выглядит так:

  • Индия
    • Мумбаи: 19 000 000
    • Калькутта: 15 000 000
  • Соединенные Штаты Америки
    • Нью-Йорк: 20 000 000
    • Чикаго: 7 000 000
  • Япония
    • Токио: 33 000 000

Это также работает на QuerySet я верю.

источник: https://docs.djangoproject.com/en/2.1/ref/templates/builtins/#regroup

Ответ 5

Существует модуль, который позволяет группировать модели Django и по-прежнему работать с QuerySet в результате: https://github.com/kako-nawao/django-group-by

Например:

from django_group_by import GroupByMixin

class BookQuerySet(QuerySet, GroupByMixin):
    pass

class Book(Model):
    title = TextField(...)
    author = ForeignKey(User, ...)
    shop = ForeignKey(Shop, ...)
    price = DecimalField(...)

class GroupedBookListView(PaginationMixin, ListView):
    template_name = 'book/books.html'
    model = Book
    paginate_by = 100

    def get_queryset(self):
        return Book.objects.group_by('title', 'author').annotate(
            shop_count=Count('shop'), price_avg=Avg('price')).order_by(
            'name', 'author').distinct()

    def get_context_data(self, **kwargs):
        return super().get_context_data(total_count=self.get_queryset().count(), **kwargs)

'книга/books.html

<ul>
{% for book in object_list %}
    <li>
        <h2>{{ book.title }}</td>
        <p>{{ book.author.last_name }}, {{ book.author.first_name }}</p>
        <p>{{ book.shop_count }}</p>
        <p>{{ book.price_avg }}</p>
    </li>
{% endfor %}
</ul>

Разница с базовыми Django-запросами annotate/aggregate заключается в использовании атрибутов связанного поля, например. book.author.last_name.

Если вам нужны PK экземпляров, которые были сгруппированы вместе, добавьте следующую аннотацию:

.annotate(pks=ArrayAgg('id'))

ПРИМЕЧАНИЕ. ArrayAgg - это специальная функция Postgres, доступная с Django 1.9 и далее: https://docs.djangoproject.com/en/1.10/ref/contrib/postgres/aggregates/#arrayagg

Ответ 6

Django не поддерживает свободную группу по запросам. Я узнал это очень плохо. ORM не предназначен для поддержки таких вещей, как то, что вы хотите сделать, без использования пользовательского SQL. Вы ограничены:

  • RAW sql (т.е. MyModel.objects.raw())
  • cr.execute (и ручной анализ результата).
  • .annotate() (группа по предложениям выполняется в дочерней модели для .annotate() в примерах, таких как aggregating lines_count = Count ('lines'))).

В запросе qs вы можете вызвать qs.query.group_by = ['field1', 'field2', ...], но это рискованно, если вы не знаете, какой запрос вы редактируете, и не имеете гарантии, что он будет работать, а не нарушать внутренние объекты QuerySet. Кроме того, это внутренний (недокументированный) API, к которому вы не должны обращаться напрямую, не рискуя тем, что код больше не совместим с будущими версиями Django.

Ответ 7

В документе говорится, что вы можете использовать значения для группировки набора запросов.

class Travel(models.Model):
    interest = models.ForeignKey(Interest)
    user = models.ForeignKey(User)
    time = models.DateTimeField(auto_now_add=True)

# Find the travel and group by the interest:

>>> Travel.objects.values('interest').annotate(Count('user'))
<QuerySet [{'interest': 5, 'user__count': 2}, {'interest': 6, 'user__count': 1}]>
# the interest(id=5) had been visited for 2 times, 
# and the interest(id=6) had only been visited for 1 time.

>>> Travel.objects.values('interest').annotate(Count('user', distinct=True)) 
<QuerySet [{'interest': 5, 'user__count': 1}, {'interest': 6, 'user__count': 1}]>
# the interest(id=5) had been visited by only one person (but this person had 
#  visited the interest for 2 times

Вы можете найти все книги и сгруппировать их по имени с помощью этого кода:

Book.objects.values('name').annotate(Count('id')).order_by() # ensure you add the order_by()

Вы можете посмотреть некоторые листовки здесь.

Ответ 8

Если я не ошибаюсь, вы можете использовать, независимо от запроса-set.group_by = ['field']

Ответ 9

from django.db.models import Sum
Members.objects.annotate(total=Sum(designation))

сначала нужно импортировать сумму потом..