Каков самый короткий путь в .NET для сортировки строк, начиная с 1, 10 и 2, и уважать порядок номеров?

Мне нужно отсортировать имена файлов следующим образом: 1.log, 2.log, 10.log

Но когда я использую OrderBy (fn = > fn), он будет сортировать их как: 1.log, 10.log, 2.log

Я, очевидно, знаю, что это можно сделать, написав другой сравнитель, но есть ли более простой способ перейти от лексикографического порядка к естественному порядку сортировки?

Изменить: цель состоит в том, чтобы получить тот же порядок, что и при выборе "порядок по имени" в проводнике Windows.

Ответ 1

Вы можете использовать функцию Win32 CompareStringEx. В Windows 7 он поддерживает сортировку, в которой вы нуждаетесь. У вас будет использование P/Invoke:

static readonly Int32 NORM_IGNORECASE = 0x00000001;
static readonly Int32 NORM_IGNORENONSPACE = 0x00000002;
static readonly Int32 NORM_IGNORESYMBOLS = 0x00000004;
static readonly Int32 LINGUISTIC_IGNORECASE = 0x00000010;
static readonly Int32 LINGUISTIC_IGNOREDIACRITIC = 0x00000020;
static readonly Int32 NORM_IGNOREKANATYPE = 0x00010000;
static readonly Int32 NORM_IGNOREWIDTH = 0x00020000;
static readonly Int32 NORM_LINGUISTIC_CASING = 0x08000000;
static readonly Int32 SORT_STRINGSORT = 0x00001000;
static readonly Int32 SORT_DIGITSASNUMBERS = 0x00000008; 

static readonly String LOCALE_NAME_USER_DEFAULT = null;
static readonly String LOCALE_NAME_INVARIANT = String.Empty;
static readonly String LOCALE_NAME_SYSTEM_DEFAULT = "!sys-default-locale";

[DllImport("kernel32.dll", CharSet = CharSet.Unicode)]
static extern Int32 CompareStringEx(
  String localeName,
  Int32 flags,
  String str1,
  Int32 count1,
  String str2,
  Int32 count2,
  IntPtr versionInformation,
  IntPtr reserved,
  Int32 param
);

Затем вы можете создать IComparer, который использует флаг SORT_DIGITSASNUMBERS:

class LexicographicalComparer : IComparer<String> {

  readonly String locale;

  public LexicographicalComparer() : this(CultureInfo.CurrentCulture) { }

  public LexicographicalComparer(CultureInfo cultureInfo) {
    if (cultureInfo.IsNeutralCulture)
      this.locale = LOCALE_NAME_INVARIANT;
    else
      this.locale = cultureInfo.Name;
  }

  public Int32 Compare(String x, String y) {
    // CompareStringEx return 1, 2, or 3. Subtract 2 to get the return value.
    return CompareStringEx( 
      this.locale, 
      SORT_DIGITSASNUMBERS, // Add other flags if required.
      x, 
      x.Length, 
      y, 
      y.Length, 
      IntPtr.Zero, 
      IntPtr.Zero, 
      0) - 2; 
  }

}

Затем вы можете использовать IComparer в различных API сортировки:

var names = new [] { "2.log", "10.log", "1.log" };
var sortedNames = names.OrderBy(s => s, new LexicographicalComparer());

Вы также можете использовать StrCmpLogicalW, который является функцией, используемой проводником Windows. Он доступен с Windows XP:

[DllImport("shlwapi.dll", CharSet = CharSet.Unicode)]
static extern Int32 StrCmpLogical(String x, String y);

class LexicographicalComparer : IComparer<String> {

  public Int32 Compare(String x, String y) {
    return StrCmpLogical(x, y);
  }

}

Проще, но у вас меньше контроля над сравнением.

Ответ 2

Если имена файлов всегда состоят только из цифр, вы можете использовать Path.GetFileNameWithoutExtension() для отказа от расширения файла и Convert.ToInt32() (или аналогичный) для преобразования имен файлов в целые числа для сравнения:

var ordered = yourFileNames.OrderBy(
    fn => Convert.ToInt32(Path.GetFileNameWithoutExtension(fn)));

В общем случае, или если вы ищете более "стандартный" способ сделать это, вы можете p/invoke StrCmpLogicalW(), который Explorer использует для сортировки имен файлов в своих представлениях. Однако выполнение этого приведет к тому, что вы выполните IComparer<string>, если хотите использовать OrderBy().

Ответ 4

Вы можете просто удалить все незнаковые символы, разобрать на int и затем отсортировать:

Regex r = new Regex(@"[^\d]");
OrderBy(fn => int.Parse(r.Replace(fn, "")));

Ответ 5

Простейшим (не обязательно быстрым/оптимальным) способом было бы ИМХО, чтобы оставить их все до определенной предопределенной максимальной длины с нулями. То есть.

var data = new[] { "1.log", "10.log", "2.log" };
data.OrderBy(x => x.PadLeft(10, '0')).Dump();

Ответ 6

Было бы проще, если бы это был лексикографический порядок,

Сравнение строк всегда является буквой.

Как вы хотите справиться с этим, не глядя на целое число?

Нет. Единственным решением является отдельный компаратор.

Ответ 7

нет. Я так не думаю. Думаю, вам нужно написать это самостоятельно, пока ваши данные являются просто строкой. Если вы сделаете свои данные чем-то вроде

struct LogDescription
{
   public int LogBase { get; set; }
   public override ToString()
   { return string.Format("{0}.log", LogBase); }
}

вы можете сортировать, используя поле LogBase-Field

Ответ 8

Вы можете сделать что-то подобное, если вы можете гарантировать формат ваших имен: NUMBER.VALUE:

var q = strings.Select(s => s.Split(new[] {'.'}, 2))
    .Select(s => new
                        {
                            Number = Convert.ToInt32(s[0]),
                            Name = s[1]
                        })
    .OrderBy(s => s.Number)
    .Select(s => string.Format("{0}.{1}", s.Number, s.Name));