Как отсортировать список объектов на основе атрибута объектов?

У меня есть список объектов Python, которые я хотел бы отсортировать по атрибуту самих объектов. Список выглядит следующим образом:

>>> ut
[<Tag: 128>, <Tag: 2008>, <Tag: <>, <Tag: actionscript>, <Tag: addresses>,
 <Tag: aes>, <Tag: ajax> ...]

Каждый объект имеет счетчик:

>>> ut[1].count
1L

Мне нужно отсортировать список по количеству убывающих счетчиков.

Я видел несколько методов для этого, но я ищу лучшую практику в Python.

Ответ 1

# To sort the list in place...
ut.sort(key=lambda x: x.count, reverse=True)

# To return a new list, use the sorted() built-in function...
newlist = sorted(ut, key=lambda x: x.count, reverse=True)

Подробнее о сортировке по ключам.

Ответ 2

Самый быстрый способ, особенно если в вашем списке много записей, - использовать operator.attrgetter("count"). Однако это может выполняться на предоператорной версии Python, поэтому было бы неплохо иметь запасной механизм. Тогда вы можете сделать следующее:

try: import operator
except ImportError: keyfun= lambda x: x.count # use a lambda if no operator module
else: keyfun= operator.attrgetter("count") # use operator since it faster than lambda

ut.sort(key=keyfun, reverse=True) # sort in-place

Ответ 3

Читатели должны заметить, что ключ = метод:

ut.sort(key=lambda x: x.count, reverse=True)

во много раз быстрее, чем добавление к объектам ярких операторов сравнения. Я был удивлен, прочитав это (стр. 485 "Python в двух словах" ). Вы можете подтвердить это, выполнив тесты по этой маленькой программе:

#!/usr/bin/env python
import random

class C:
    def __init__(self,count):
        self.count = count

    def __cmp__(self,other):
        return cmp(self.count,other.count)

longList = [C(random.random()) for i in xrange(1000000)] #about 6.1 secs
longList2 = longList[:]

longList.sort() #about 52 - 6.1 = 46 secs
longList2.sort(key = lambda c: c.count) #about 9 - 6.1 = 3 secs

Мои, очень минимальные тесты показывают, что первый сорт более чем в 10 раз медленнее, но в книге говорится, что в целом он всего лишь в 5 раз медленнее. Причина, по которой они говорят, объясняется очень оптимизированным алгоритмом сортировки, используемым в python (timsort).

Тем не менее, очень странно, что .sort(lambda) быстрее, чем простой старый .sort(). Надеюсь, они это исправит.

Ответ 4

from operator import attrgetter
ut.sort(key = attrgetter('count'), reverse = True)

Ответ 5

Объектно-ориентированный подход

Хорошей практикой является сделать логику сортировки объектов, если это применимо, свойством класса, а не включенным в каждом случае, когда требуется упорядочение.

Это обеспечивает согласованность и устраняет необходимость использования стандартного кода.

Как минимум, вы должны указать __eq__ и __lt__ чтобы это работало. Тогда просто используйте sorted(list_of_objects).

class Card(object):

    def __init__(self, rank, suit):
        self.rank = rank
        self.suit = suit

    def __eq__(self, other):
        return self.rank == other.rank and self.suit == other.suit

    def __lt__(self, other):
        return self.rank < other.rank

hand = [Card(10, 'H'), Card(2, 'h'), Card(12, 'h'), Card(13, 'h'), Card(14, 'h')]
hand_order = [c.rank for c in hand]  # [10, 2, 12, 13, 14]

hand_sorted = sorted(hand)
hand_sorted_order = [c.rank for c in hand_sorted]  # [2, 10, 12, 13, 14]

Ответ 6

Он очень похож на список экземпляров модели Django ORM.

Почему бы не отсортировать их по запросу:

ut = Tag.objects.order_by('-count')

Ответ 7

Добавьте богатых операторов сравнения в класс объектов, затем используйте метод sort() списка.
См. богатое сравнение в python.


Обновить. Хотя этот метод будет работать, я думаю, что решение от Triptych лучше подходит для вашего случая, потому что проще.

Ответ 8

Если атрибут, по которому вы хотите отсортировать, является свойством, тогда вы можете избежать импорта operator.attrgetter и использовать метод свойства fget.

Например, для класса Circle со свойством radius мы могли бы отсортировать список circles по радиусам следующим образом:

result = sorted(circles, key=Circle.radius.fget)

Это не самая известная функция, но она часто спасает меня от необходимости импорта.