Естественная сортировка в MySQL

Есть ли элегантный способ иметь естественную сортировку в базе данных MySQL?

Например, если у меня есть этот набор данных:

  • Final Fantasy
  • Final Fantasy 4
  • Final Fantasy 10
  • Final Fantasy 12
  • Final Fantasy 12: Цепи Проматии
  • Final Fantasy Adventure
  • Начало финальной фантазии
  • Final Fantasy Tactics

Любое другое элегантное решение, чем разделение имен игр на их компоненты

  • Название: "Final Fantasy"
  • Номер: "12"
  • Субтитры: "Цепочки Промации"

чтобы убедиться, что они вышли в правильном порядке? (10 после 4, не ранее 2).

Это боль в **, потому что время от времени появляется другая игра, которая нарушает этот механизм разбора названия игры (например, "Warhammer 40,000", "James Bond 007" )

Ответ 1

Я думаю, именно поэтому многие вещи сортируются по дате выпуска.

Решением может быть создание другого столбца в таблице для "SortKey". Это может быть санированная версия названия, которая соответствует шаблону, который вы создаете для удобной сортировки или счетчика.

Ответ 2

Вот быстрое решение:

SELECT alphanumeric, 
       integer
FROM sorting_test
ORDER BY LENGTH(alphanumeric), alphanumeric

Ответ 3

Только что нашел это:

SELECT names FROM your_table ORDER BY games + 0 ASC

Является ли естественный вид, когда цифры находятся на передней панели, может работать и на середине.

Ответ 4

Те же функции, что и @plalx, ​​но переписаны в MySQL:

DROP FUNCTION IF EXISTS `udf_FirstNumberPos`;
DELIMITER ;;
CREATE FUNCTION `udf_FirstNumberPos` (`instring` varchar(4000)) 
RETURNS int
LANGUAGE SQL
DETERMINISTIC
NO SQL
SQL SECURITY INVOKER
BEGIN
    DECLARE position int;
    DECLARE tmp_position int;
    SET position = 5000;
    SET tmp_position = LOCATE('0', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF; 
    SET tmp_position = LOCATE('1', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('2', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('3', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('4', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('5', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('6', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('7', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('8', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;
    SET tmp_position = LOCATE('9', instring); IF (tmp_position > 0 AND tmp_position < position) THEN SET position = tmp_position; END IF;

    IF (position = 5000) THEN RETURN 0; END IF;
    RETURN position;
END
;;

DROP FUNCTION IF EXISTS `udf_NaturalSortFormat`;
DELIMITER ;;
CREATE FUNCTION `udf_NaturalSortFormat` (`instring` varchar(4000), `numberLength` int, `sameOrderChars` char(50)) 
RETURNS varchar(4000)
LANGUAGE SQL
DETERMINISTIC
NO SQL
SQL SECURITY INVOKER
BEGIN
    DECLARE sortString varchar(4000);
    DECLARE numStartIndex int;
    DECLARE numEndIndex int;
    DECLARE padLength int;
    DECLARE totalPadLength int;
    DECLARE i int;
    DECLARE sameOrderCharsLen int;

    SET totalPadLength = 0;
    SET instring = TRIM(instring);
    SET sortString = instring;
    SET numStartIndex = udf_FirstNumberPos(instring);
    SET numEndIndex = 0;
    SET i = 1;
    SET sameOrderCharsLen = CHAR_LENGTH(sameOrderChars);

    WHILE (i <= sameOrderCharsLen) DO
        SET sortString = REPLACE(sortString, SUBSTRING(sameOrderChars, i, 1), ' ');
        SET i = i + 1;
    END WHILE;

    WHILE (numStartIndex <> 0) DO
        SET numStartIndex = numStartIndex + numEndIndex;
        SET numEndIndex = numStartIndex;

        WHILE (udf_FirstNumberPos(SUBSTRING(instring, numEndIndex, 1)) = 1) DO
            SET numEndIndex = numEndIndex + 1;
        END WHILE;

        SET numEndIndex = numEndIndex - 1;

        SET padLength = numberLength - (numEndIndex + 1 - numStartIndex);

        IF padLength < 0 THEN
            SET padLength = 0;
        END IF;

        SET sortString = INSERT(sortString, numStartIndex + totalPadLength, 0, REPEAT('0', padLength));

        SET totalPadLength = totalPadLength + padLength;
        SET numStartIndex = udf_FirstNumberPos(RIGHT(instring, CHAR_LENGTH(instring) - numEndIndex));
    END WHILE;

    RETURN sortString;
END
;;

Использование:

SELECT name FROM products ORDER BY udf_NaturalSortFormat(name, 10, ".")

Ответ 5

Я написал эту функцию для MSSQL 2000 некоторое время назад:

/**
 * Returns a string formatted for natural sorting. This function is very useful when having to sort alpha-numeric strings.
 *
 * @author Alexandre Potvin Latreille (plalx)
 * @param {nvarchar(4000)} string The formatted string.
 * @param {int} numberLength The length each number should have (including padding). This should be the length of the longest number. Defaults to 10.
 * @param {char(50)} sameOrderChars A list of characters that should have the same order. Ex: '.-/'. Defaults to empty string.
 *
 * @return {nvarchar(4000)} A string for natural sorting.
 * Example of use: 
 * 
 *      SELECT Name FROM TableA ORDER BY Name
 *  TableA (unordered)              TableA (ordered)
 *  ------------                    ------------
 *  ID  Name                    ID  Name
 *  1.  A1.                 1.  A1-1.       
 *  2.  A1-1.                   2.  A1.
 *  3.  R1      -->         3.  R1
 *  4.  R11                 4.  R11
 *  5.  R2                  5.  R2
 *
 *  
 *  As we can see, humans would expect A1., A1-1., R1, R2, R11 but that not how SQL is sorting it.
 *  We can use this function to fix this.
 *
 *      SELECT Name FROM TableA ORDER BY dbo.udf_NaturalSortFormat(Name, default, '.-')
 *  TableA (unordered)              TableA (ordered)
 *  ------------                    ------------
 *  ID  Name                    ID  Name
 *  1.  A1.                 1.  A1.     
 *  2.  A1-1.                   2.  A1-1.
 *  3.  R1      -->         3.  R1
 *  4.  R11                 4.  R2
 *  5.  R2                  5.  R11
 */
CREATE FUNCTION dbo.udf_NaturalSortFormat(
    @string nvarchar(4000),
    @numberLength int = 10,
    @sameOrderChars char(50) = ''
)
RETURNS varchar(4000)
AS
BEGIN
    DECLARE @sortString varchar(4000),
        @numStartIndex int,
        @numEndIndex int,
        @padLength int,
        @totalPadLength int,
        @i int,
        @sameOrderCharsLen int;

    SELECT 
        @totalPadLength = 0,
        @string = RTRIM(LTRIM(@string)),
        @sortString = @string,
        @numStartIndex = PATINDEX('%[0-9]%', @string),
        @numEndIndex = 0,
        @i = 1,
        @sameOrderCharsLen = LEN(@sameOrderChars);

    -- Replace all char that has to have the same order by a space.
    WHILE (@i <= @sameOrderCharsLen)
    BEGIN
        SET @sortString = REPLACE(@sortString, SUBSTRING(@sameOrderChars, @i, 1), ' ');
        SET @i = @i + 1;
    END

    -- Pad numbers with zeros.
    WHILE (@numStartIndex <> 0)
    BEGIN
        SET @numStartIndex = @numStartIndex + @numEndIndex;
        SET @numEndIndex = @numStartIndex;

        WHILE(PATINDEX('[0-9]', SUBSTRING(@string, @numEndIndex, 1)) = 1)
        BEGIN
            SET @numEndIndex = @numEndIndex + 1;
        END

        SET @numEndIndex = @numEndIndex - 1;

        SET @padLength = @numberLength - (@numEndIndex + 1 - @numStartIndex);

        IF @padLength < 0
        BEGIN
            SET @padLength = 0;
        END

        SET @sortString = STUFF(
            @sortString,
            @numStartIndex + @totalPadLength,
            0,
            REPLICATE('0', @padLength)
        );

        SET @totalPadLength = @totalPadLength + @padLength;
        SET @numStartIndex = PATINDEX('%[0-9]%', RIGHT(@string, LEN(@string) - @numEndIndex));
    END

    RETURN @sortString;
END

GO

Ответ 6

MySQL не разрешает такую ​​ "естественную сортировку", так что лучший способ получить то, что вам нужно, - разделить данные, как описано выше (отдельное поле id и т.д.), или сбой в этом, выполните сортировку на основе элемента без заголовка, проиндексированного элемента в вашем db (дата, вставленный идентификатор в db и т.д.).

У db сортировка для вас почти всегда будет быстрее, чем чтение больших наборов данных на ваш выбор языка программирования и их сортировка там, поэтому, если у вас есть какой-либо контроль над схемой db здесь, посмотрите на добавление легко отсортированных полей, как описано выше, это сэкономит вам много хлопот и обслуживания в долгосрочной перспективе.

Запросы на добавление "натурального сорта" время от времени появляются на ошибках MySQL и дискуссионные форумы, и многие решения вращаются вокруг выделения определенных частей ваших данных и их литья для ORDER BY части запроса, например

SELECT * FROM table ORDER BY CAST(mid(name, 6, LENGTH(c) -5) AS unsigned) 

Такое решение могло бы быть сделано для работы над вашим примером Final Fantasy выше, но не является особенно гибким и вряд ли просто распространяется на набор данных, включая, скажем, "Warhammer 40,000" и "James Bond 007" я Боюсь.

Ответ 7

Итак, хотя я знаю, что вы нашли удовлетворительный ответ, я некоторое время боролся с этой проблемой, и мы ранее определили, что это не может быть сделано достаточно хорошо в SQL, и нам придется использовать javascript на массиве JSON.

Вот как я решил это, просто используя SQL. Надеюсь, это полезно для других:

У меня были такие данные, как:

Scene 1
Scene 1A
Scene 1B
Scene 2A
Scene 3
...
Scene 101
Scene XXA1
Scene XXA2

Я действительно не "бросал" вещи, хотя, я полагаю, это тоже сработало.

Я сначала заменил части, которые были неизменными в данных, в данном случае "Сцена", а затем сделал LPAD, чтобы подвести итоги. Это, похоже, довольно хорошо подходит для альфа-строк для правильной сортировки, а также для пронумерованных.

Мое предложение ORDER BY выглядит следующим образом:

ORDER BY LPAD(REPLACE(`table`.`column`,'Scene ',''),10,'0')

Очевидно, это не помогает с оригинальной проблемой, которая была не столь однородной - но я полагаю, что это, вероятно, будет работать для многих других связанных с этим проблем, поэтому поместив ее там.

Ответ 8

  • Добавить ключ сортировки (ранг) в таблицу. ORDER BY rank

  • Используйте столбец "Дата выпуска". ORDER BY release_date

  • При извлечении данных из SQL сделайте свой объект сортировкой, например, при извлечении в Set, сделайте его TreeSet и создайте модель данных Comparable и определите здесь алгоритм естественной сортировки (вставка sort будет достаточно, если вы используете язык без коллекций), поскольку вы будете считывать строки из SQL по одному при создании своей модели и вставлять ее в коллекцию)

Ответ 9

Относительно лучшего ответа от Ричарда Тота fooobar.com/questions/79862/...

Следите за закодированными строками UTF8, которые содержат 2 байта (или более) символов и цифр, например.

12 南新宿

Использование MySQL LENGTH() в udf_NaturalSortFormat функция вернет длину байта строки и будет неправильной, вместо этого используйте CHAR_LENGTH(), которая вернет правильную длину символа.

В моем случае, используя LENGTH(), вызванные запросы никогда не завершаются и приводят к 100% использованию ЦП для MySQL

DROP FUNCTION IF EXISTS `udf_NaturalSortFormat`;
DELIMITER ;;
CREATE FUNCTION `udf_NaturalSortFormat` (`instring` varchar(4000), `numberLength` int, `sameOrderChars` char(50)) 
RETURNS varchar(4000)
LANGUAGE SQL
DETERMINISTIC
NO SQL
SQL SECURITY INVOKER
BEGIN
    DECLARE sortString varchar(4000);
    DECLARE numStartIndex int;
    DECLARE numEndIndex int;
    DECLARE padLength int;
    DECLARE totalPadLength int;
    DECLARE i int;
    DECLARE sameOrderCharsLen int;

    SET totalPadLength = 0;
    SET instring = TRIM(instring);
    SET sortString = instring;
    SET numStartIndex = udf_FirstNumberPos(instring);
    SET numEndIndex = 0;
    SET i = 1;
    SET sameOrderCharsLen = CHAR_LENGTH(sameOrderChars);

    WHILE (i <= sameOrderCharsLen) DO
        SET sortString = REPLACE(sortString, SUBSTRING(sameOrderChars, i, 1), ' ');
        SET i = i + 1;
    END WHILE;

    WHILE (numStartIndex <> 0) DO
        SET numStartIndex = numStartIndex + numEndIndex;
        SET numEndIndex = numStartIndex;

        WHILE (udf_FirstNumberPos(SUBSTRING(instring, numEndIndex, 1)) = 1) DO
            SET numEndIndex = numEndIndex + 1;
        END WHILE;

        SET numEndIndex = numEndIndex - 1;

        SET padLength = numberLength - (numEndIndex + 1 - numStartIndex);

        IF padLength < 0 THEN
            SET padLength = 0;
        END IF;

        SET sortString = INSERT(sortString, numStartIndex + totalPadLength, 0, REPEAT('0', padLength));

        SET totalPadLength = totalPadLength + padLength;
        SET numStartIndex = udf_FirstNumberPos(RIGHT(instring, CHAR_LENGTH(instring) - numEndIndex));
    END WHILE;

    RETURN sortString;
END
;;

p.s. Я бы добавил это как комментарий к оригиналу, но у меня нет достаточной репутации (пока)

Ответ 10

Другой вариант - выполнить сортировку в памяти после извлечения данных из mysql. Хотя это не будет лучшим вариантом с точки зрения производительности, если вы не сортируете огромные списки, все будет в порядке.

Если вы посмотрите на пост Джеффа, вы сможете найти множество алгоритмов для любого языка, с которым вы можете работать. Сортировка для людей: естественный порядок сортировки

Ответ 11

Добавьте поле для "ключа сортировки", которое содержит все строки цифр с нулевой шириной до фиксированной длины, а затем вместо этого сортирует это поле.

Если у вас могут быть длинные строки цифр, другой метод заключается в том, чтобы добавить число цифр (фиксированная ширина, нуль-padded) к каждой строке цифр. Например, если у вас не будет более 99 цифр подряд, то для "Super Blast 10 Ultra" ключ сортировки будет "Super Blast 0210 Ultra".

Ответ 12

Заказать:
0
1
2
10
23
101
205
1000
a
aac
b
casdsadsa
css

Используйте этот запрос:

SELECT 
    column_name 
FROM 
    table_name 
ORDER BY
    column_name REGEXP '^\d*[^\da-z&\.\' \-\"\!\@\#\$\%\^\*\(\)\;\:\\,\?\/\~\`\|\_\-]' DESC, 
    column_name + 0, 
    column_name;

Ответ 13

Если вы не хотите изобретать колесо или иметь головную боль с большим количеством кода, который не работает, просто используйте Drupal Natural Sort... Просто запустите SQL, который зашифрован (MySQL или Postgre), и что он. При выполнении запроса просто заказывайте, используя:

... ORDER BY natsort_canon(column_name, 'natural')

Ответ 14

Вы также можете создать динамическим способом столбец сортировки:

SELECT name, (name = '-') boolDash, (name = '0') boolZero, (name+0 > 0) boolNum 
FROM table 
ORDER BY boolDash DESC, boolZero DESC, boolNum DESC, (name+0), name

Таким образом, вы можете создавать группы для сортировки.

В моем запросе я хотел "-" перед всем, затем цифры, затем текст. Это может привести к чему-то вроде:

-
0    
1
2
3
4
5
10
13
19
99
102
Chair
Dog
Table
Windows

Таким образом, при добавлении данных вам не нужно поддерживать столбец сортировки в правильном порядке. Вы также можете изменить порядок сортировки в зависимости от того, что вам нужно.

Ответ 15

Если вы используете PHP, вы можете сделать естественный вид в php.

$keys = array();
$values = array();
foreach ($results as $index => $row) {
   $key = $row['name'].'__'.$index; // Add the index to create an unique key.
   $keys[] = $key;
   $values[$key] = $row; 
}
natsort($keys);
$sortedValues = array(); 
foreach($keys as $index) {
  $sortedValues[] = $values[$index]; 
}

Я надеюсь, что MySQL выполнит естественную сортировку в будущей версии, но запрос функции (# 1588) открыт с 2003 года, поэтому я бы Не задерживай дыхание.

Ответ 16

Упрощенная не-udf-версия наилучшего ответа @plaix/Richard Toth/Luke Hoggett, которая работает только для первого целого в поле,

SELECT name,
LEAST(
    IFNULL(NULLIF(LOCATE('0', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('1', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('2', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('3', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('4', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('5', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('6', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('7', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('8', name), 0), ~0),
    IFNULL(NULLIF(LOCATE('9', name), 0), ~0)
) AS first_int
FROM table
ORDER BY IF(first_int = ~0, name, CONCAT(
    SUBSTR(name, 1, first_int - 1),
    LPAD(CAST(SUBSTR(name, first_int) AS UNSIGNED), LENGTH(~0), '0'),
    SUBSTR(name, first_int + LENGTH(CAST(SUBSTR(name, first_int) AS UNSIGNED)))
)) ASC

Ответ 17

Я попробовал несколько решений, но на самом деле это очень просто:

SELECT test_column FROM test_table ORDER BY LENGTH(test_column) DESC, test_column DESC

/* 
Result 
--------
value_1
value_2
value_3
value_4
value_5
value_6
value_7
value_8
value_9
value_10
value_11
value_12
value_13
value_14
value_15
...
*/

Ответ 18

Многие другие ответы, которые я вижу здесь (и в повторяющихся вопросах), в основном работают только для очень конкретно отформатированных данных, например, строка, которая целиком является числом или для которой существует алфавитный префикс фиксированной длины. Это не сработает в общем случае.

Это правда, что на самом деле нет никакого способа реализовать 100% -ную общую nat-сортировку в MySQL, потому что для этого вам действительно нужна модифицированная функция сравнения, которая переключается между лексикографической сортировкой строк и числовой сортировкой, если/когда встречается число. Такой код может реализовать любой алгоритм, который вы захотите распознать и сравнить числовые части в двух строках. К сожалению, функция сравнения в MySQL является внутренней по отношению к своему коду и не может быть изменена пользователем.

Это оставляет некоторый хак, где вы пытаетесь создать ключ сортировки для вашей строки, в котором числовые части переформатируются так, чтобы стандартная лексикографическая сортировка фактически сортировала их так, как вы хотите.

Для простых целых чисел до некоторого максимального числа цифр очевидное решение состоит в том, чтобы просто дополнить их нулями, чтобы они все имели фиксированную ширину. Это подход, принятый плагином Drupal, и решения @plalx/@RichardToth. (У @Christian есть другое и гораздо более сложное решение, но оно не дает никаких преимуществ, которые я вижу).

Как указывает @tye, вы можете улучшить это, добавив фиксированную длину цифры к каждому числу, а не просто добавив его слева. Там можно многое, гораздо больше, что вы можете улучшить, даже если учесть ограничения того, что по сути является неуклюжим взломом. Тем не менее, кажется, нет никаких готовых решений там!

Например, как насчет:

  • Плюс и минус? +10 против 10 против -10
  • Десятичные? 8,2, 8,5, 1,006, 0,75
  • Ведущие нули? 020, 030, 00000922
  • Тысячи разделителей? "1 001 Далмация" против "1001 Далмации"
  • Номера версий? MariaDB v10.3.18 против MariaDB v10.3.3
  • Очень длинные цифры? 103,768,276,592,092,364,859,236,487,687,870,234,598.55

Расширяя метод @tye, я создал довольно компактную хранимую функцию NatSortKey(), которая преобразует произвольную строку в ключ nat-sort, обрабатывает все вышеперечисленные случаи, достаточно эффективна и сохраняет общую сортировку. порядок (нет двух разных строк имеют ключи сортировки, которые сравниваются одинаково). Второй параметр может использоваться для ограничения числа чисел, обрабатываемых в каждой строке (например, до первых 10 чисел, скажем), который может использоваться для обеспечения соответствия выходных данных в пределах заданной длины.

ПРИМЕЧАНИЕ. Строка ключа сортировки, созданная с заданным значением этого 2-го параметра, должна сортироваться только по другим строкам, созданным с тем же значением для параметра, иначе они могут сортироваться неправильно!

Вы можете использовать его непосредственно при оформлении заказа, например,

SELECT myString FROM myTable ORDER BY NatSortKey(myString,0);  ### 0 means process all numbers - resulting sort key might be quite long for certain inputs

Но для эффективной сортировки больших таблиц лучше предварительно сохранить ключ сортировки в другом столбце (возможно, с индексом на нем):

INSERT INTO myTable (myString,myStringNSK) VALUES (@theStringValue,NatSortKey(@theStringValue,10)), ...
...
SELECT myString FROM myTable ORDER BY myStringNSK;

[В идеале это можно сделать автоматически, создав ключевой столбец как вычисленный сохраненный столбец, используя что-то вроде:

CREATE TABLE myTable (
...
myString varchar(100),
myStringNSK varchar(150) AS (NatSortKey(myString,10)) STORED,
...
KEY (myStringNSK),
...);

Но пока ни MySQL, ни MariaDB не разрешают сохранять функции в вычисляемых столбцах, поэтому, к сожалению, вы пока не можете этого сделать.]


Моя функция влияет только на сортировку чисел. Если вы хотите выполнить другие действия по нормализации сортировки, такие как удаление всех знаков препинания или обрезка пробелов с каждого конца, или замена последовательностей из нескольких пробелов одиночными пробелами, вы можете либо расширить функцию, либо это можно сделать до или после NatSortKey() применяется к вашим данным. (Я бы порекомендовал использовать REGEXP_REPLACE() для этой цели).

Это также несколько англоцентрично в том смысле, что я предполагаю "." для десятичной точки и ',' для разделителя тысяч, но это должно быть достаточно легко изменить, если вы хотите обратное, или если вы хотите, чтобы это можно было переключать в качестве параметра.

Это может быть поддается дальнейшему улучшению другими способами; например, в настоящее время он сортирует отрицательные числа по абсолютному значению, поэтому -1 предшествует -2, а не наоборот. Также нет способа указать порядок сортировки DESC для чисел, сохранив лексикографическую сортировку ASC для текста. Обе эти проблемы могут быть исправлены с помощью немного больше работы; Я обновлю код, если/когда получу время.

Есть много других деталей, о которых нужно знать, - включая некоторые критические зависимости от используемой вами последовательности и параметров сортировки, - но я поместил их все в блок комментариев в коде SQL. Пожалуйста, внимательно прочитайте это, прежде чем использовать функцию для себя!

Итак, вот код. Если вы обнаружите ошибку или обнаружите улучшение, о котором я не упомянул, сообщите мне об этом в комментариях!


delimiter $$
CREATE DEFINER=CURRENT_USER FUNCTION NatSortKey (s varchar(100), n int) RETURNS varchar(350) DETERMINISTIC
BEGIN
/****
  Converts numbers in the input string s into a format such that sorting results in a nat-sort.
  Numbers of up to 359 digits (before the decimal point, if one is present) are supported.  Sort results are undefined if the input string contains numbers longer than this.
  For n>0, only the first n numbers in the input string will be converted for nat-sort (so strings that differ only after the first n numbers will not nat-sort amongst themselves).
  Total sort-ordering is preserved, i.e. if s1!=s2, then NatSortKey(s1,n)!=NatSortKey(s2,n), for any given n.
  Numbers may contain ',' as a thousands separator, and '.' as a decimal point.  To reverse these (as appropriate for some European locales), the code would require modification.
  Numbers preceded by '+' sort with numbers not preceded with either a '+' or '-' sign.
  Negative numbers (preceded with '-') sort before positive numbers, but are sorted in order of ascending absolute value (so -7 sorts BEFORE -1001).
  Numbers with leading zeros sort after the same number with no (or fewer) leading zeros.
  Decimal-part-only numbers (like .75) are recognised, provided the decimal point is not immediately preceded by either another '.', or by a letter-type character.
  Numbers with thousand separators sort after the same number without them.
  Thousand separators are only recognised in numbers with no leading zeros that don't immediately follow a ',', and when they format the number correctly.
  (When not recognised as a thousand separator, a ',' will instead be treated as separating two distinct numbers).
  Version-number-like sequences consisting of 3 or more numbers separated by '.' are treated as distinct entities, and each component number will be nat-sorted.
  The entire entity will sort after any number beginning with the first component (so e.g. 10.2.1 sorts after both 10 and 10.995, but before 11)
  Note that The first number component in an entity like this is also permitted to contain thousand separators.

  To achieve this, numbers within the input string are prefixed and suffixed according to the following format:
  - The number is prefixed by a 2-digit base-36 number representing its length, excluding leading zeros.  If there is a decimal point, this length only includes the integer part of the number.
  - A 3-character suffix is appended after the number (after the decimals if present).
    - The first character is a space, or a '+' sign if the number was preceded by '+'.  Any preceding '+' sign is also removed from the front of the number.
    - This is followed by a 2-digit base-36 number that encodes the number of leading zeros and whether the number was expressed in comma-separated form (e.g. 1,000,000.25 vs 1000000.25)
    - The value of this 2-digit number is: (number of leading zeros)*2 + (1 if comma-separated, 0 otherwise)
  - For version number sequences, each component number has the prefix in front of it, and the separating dots are removed.
    Then there is a single suffix that consists of a ' ' or '+' character, followed by a pair base-36 digits for each number component in the sequence.

  e.g. here is how some simple sample strings get converted:
  'Foo055' --> 'Foo0255 02'
  'Absolute zero is around -273 centigrade' --> 'Absolute zero is around -03273 00 centigrade'
  'The $1,000,000 prize' --> 'The $071000000 01 prize'
  '+99.74 degrees' --> '0299.74+00 degrees'
  'I have 0 apples' --> 'I have 00 02 apples'
  '.5 is the same value as 0000.5000' --> '00.5 00 is the same value as 00.5000 08'
  'MariaDB v10.3.0018' --> 'MariaDB v02100130218 000004'

  The restriction to numbers of up to 359 digits comes from the fact that the first character of the base-36 prefix MUST be a decimal digit, and so the highest permitted prefix value is '9Z' or 359 decimal.
  The code could be modified to handle longer numbers by increasing the size of (both) the prefix and suffix.
  A higher base could also be used (by replacing CONV() with a custom function), provided that the collation you are using sorts the "digits" of the base in the correct order, starting with 0123456789.
  However, while the maximum number length may be increased this way, note that the technique this function uses is NOT applicable where strings may contain numbers of unlimited length.

  The function definition does not specify the charset or collation to be used for string-type parameters or variables:  The default database charset & collation at the time the function is defined will be used.
  This is to make the function code more portable.  However, there are some important restrictions:

  - Collation is important here only when comparing (or storing) the output value from this function, but it MUST order the characters " +0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ" in that order for the natural sort to work.
    This is true for most collations, but not all of them, e.g. in Lithuanian 'Y' comes before 'J' (according to Wikipedia).
    To adapt the function to work with such collations, replace CONV() in the function code with a custom function that emits "digits" above 9 that are characters ordered according to the collation in use.

  - For efficiency, the function code uses LENGTH() rather than CHAR_LENGTH() to measure the length of strings that consist only of digits 0-9, '.', and ',' characters.
    This works for any single-byte charset, as well as any charset that maps standard ASCII characters to single bytes (such as utf8 or utf8mb4).
    If using a charset that maps these characters to multiple bytes (such as, e.g. utf16 or utf32), you MUST replace all instances of LENGTH() in the function definition with CHAR_LENGTH()

  Length of the output:

  Each number converted adds 5 characters (2 prefix + 3 suffix) to the length of the string. n is the maximum count of numbers to convert;
  This parameter is provided as a means to limit the maximum output length (to input length + 5*n).
  If you do not require the total-ordering property, you could edit the code to use suffixes of 1 character (space or plus) only; this would reduce the maximum output length for any given n.
  Since a string of length L has at most ((L+1) DIV 2) individual numbers in it (every 2nd character a digit), for n<=0 the maximum output length is (inputlength + 5*((inputlength+1) DIV 2))
  So for the current input length of 100, the maximum output length is 350.
  If changing the input length, the output length must be modified according to the above formula.  The DECLARE statements for x,y,r, and suf must also be modified, as the code comments indicate.
****/
  DECLARE x,y varchar(100);            # need to be same length as input s
  DECLARE r varchar(350) DEFAULT '';   # return value:  needs to be same length as return type
  DECLARE suf varchar(101);   # suffix for a number or version string. Must be (((inputlength+1) DIV 2)*2 + 1) chars to support version strings (e.g. '1.2.33.5'), though it usually just 3 chars. (Max version string e.g. 1.2. ... .5 has ((length of input + 1) DIV 2) numeric components)
  DECLARE i,j,k int UNSIGNED;
  IF n<=0 THEN SET n := -1; END IF;   # n<=0 means "process all numbers"
  LOOP
    SET i := REGEXP_INSTR(s,'\\d');   # find position of next digit
    IF i=0 OR n=0 THEN RETURN CONCAT(r,s); END IF;   # no more numbers to process -> we're done
    SET n := n-1, suf := ' ';
    IF i>1 THEN
      IF SUBSTRING(s,i-1,1)='.' AND (i=2 OR SUBSTRING(s,i-2,1) RLIKE '[^.\p{Alphabetic}\p{Mark}\p{Decimal_Number}\p{Join_Control}]') AND (SUBSTRING(s,i) NOT RLIKE '^\\d++\\.\\d') THEN SET i:=i-1; END IF;   # Allow decimal number (but not version string) to begin with a '.', provided preceding char isn't a "letter" or another '.'
      IF i>1 AND SUBSTRING(s,i-1,1)='+' THEN SET suf := '+', j := i-1; ELSE SET j := i; END IF;   # move any preceding '+' into the suffix, so equal numbers with and without preceding "+" signs sort together
      SET r := CONCAT(r,SUBSTRING(s,1,j-1)); SET s = SUBSTRING(s,i);   # add everything before the number to r and strip it from the start of s; preceding '+' is dropped (not included in either r or s)
    END IF;
    SET x := REGEXP_SUBSTR(s,IF(SUBSTRING(s,1,1) IN ('0','.') OR (SUBSTRING(r,-1)=',' AND suf=' '),'^\\d*+(?:\\.\\d++)*','^(?:[1-9]\\d{0,2}(?:,\\d{3}(?!\\d))*+|\\d++)(?:\\.\\d++)*+'));   # capture the number + following decimals (including multiple consecutive '.<digits>' sequences)
    SET s := SUBSTRING(s,LENGTH(x)+1);   # NOTE: LENGTH() can be safely used instead of CHAR_LENGTH() here & below PROVIDED we're using a charset that represents digits, ',' and '.' characters using single bytes (e.g. latin1, utf8)
    SET i := INSTR(x,'.');
    IF i=0 THEN SET y := ''; ELSE SET y := SUBSTRING(x,i); SET x := SUBSTRING(x,1,i-1); END IF;   # move any following decimals into y
    SET i := LENGTH(x);
    SET x := REPLACE(x,',','');
    SET j := LENGTH(x);
    SET x := TRIM(LEADING '0' FROM x);   # strip leading zeros
    SET k := LENGTH(x);
    SET suf := CONCAT(suf,LPAD(CONV(LEAST((j-k)*2,1294) + IF(i=j,0,1),10,36),2,'0'));   # (j-k)*2 + IF(i=j,0,1) = (count of leading zeros)*2 + (1 if there are thousands-separators, 0 otherwise)  Note the first term is bounded to <= base-36 'ZY' as it must fit within 2 characters
    SET i := LOCATE('.',y,2);
    IF i>0 THEN   # encode a version number (like 3.12.707, etc)
      SET r := CONCAT(r,LPAD(CONV(LEAST(k,359),10,36),2,'0'),x);   # k = count of digits in number, bounded to be <= '9Z' base-36
      WHILE LENGTH(y)>0 AND n!=0 DO
        IF i=0 THEN SET x := SUBSTRING(y,2); SET y := '', i := 0; ELSE SET x := SUBSTRING(y,2,i-2); SET y := SUBSTRING(y,i); SET i := LOCATE('.',y,2); END IF;
        SET j := LENGTH(x);
        SET x := TRIM(LEADING '0' FROM x);   # strip leading zeros
        SET k := LENGTH(x);
        SET r := CONCAT(r,LPAD(CONV(LEAST(k,359),10,36),2,'0'),x);   # k = count of digits in number, bounded to be <= '9Z' base-36
        SET suf := CONCAT(suf,LPAD(CONV(LEAST((j-k)*2,1294),10,36),2,'0'));   # (j-k)*2 = (count of leading zeros)*2, bounded to fit within 2 base-36 digits
        SET n := n-1;
      END WHILE;
      SET r := CONCAT(r,y,suf);
    ELSE
      SET r := CONCAT(r,LPAD(CONV(LEAST(k,359),10,36),2,'0'),x,y,suf);   # k = count of digits in number, bounded to be <= '9Z' base-36
    END IF;
  END LOOP;
END
$$
delimiter ;

Ответ 19

Также есть natsort. Он предназначен для части плагина drupal, но он отлично работает автономно.

Ответ 20

Я знаю, что эта тема древняя, но я думаю, что нашел способ сделать это:

SELECT * FROM `table` ORDER BY 
CONCAT(
  GREATEST(
    LOCATE('1', name),
    LOCATE('2', name),
    LOCATE('3', name),
    LOCATE('4', name),
    LOCATE('5', name),
    LOCATE('6', name),
    LOCATE('7', name),
    LOCATE('8', name),
    LOCATE('9', name)
   ),
   name
) ASC

Отбросьте, что он неправильно отсортировал следующий набор (это бесполезно lol):

Final Fantasy 1 Заключительная фантазия 2 Заключительная фантазия 5 Final Fantasy 7 Final Fantasy 7: Дети пришествия Final Fantasy 12 Final Fantasy 112 FF1 FF2