С# List Comprehensions = Чистый синтаксический сахар?

Рассмотрим следующий код С#:

IEnumerable numbers = Enumerable.Range(0, 10);
var evens = from num in numbers where num % 2 == 0 select num;

Является ли этот чистый синтаксический сахар, чтобы я мог писать цикл for или foreach как однострочный? Существуют ли какие-либо оптимизаторы компилятора под обложками, которые делают понимание списков более эффективным, чем конструкция цикла? Как это работает под капотом?

Ответ 1

Как сказал Джейсон, ваш код эквивалентен:

Enumerable.Range(0, 10).Where(n => n % 2 == 0);

Обратите внимание, что лямбда будет преобразована в вызов функции, который выполняется для каждого элемента. Это, вероятно, самая большая часть накладных расходов. Я сделал тест, который указывает, что LINQ примерно в 3 раза медленнее (mono gmcs version 1.2.6.0) на этой точной задаче

    Time for 10000000 for loop reps: 00:00:17.6852560
    Time for 10000000 LINQ reps: 00:00:59.0574430

    Time for 1000000 for loop reps: 00:00:01.7671640
    Time for 1000000 LINQ reps: 00:00:05.8868350

EDIT: Gishu сообщает, что VS2008 и framework v3.5 SP1 дают:

    Time for 1000000 loop reps: :00.3724585 
    Time for 1000000 LINQ reps: :00.5119530 

LINQ примерно в 1,4 раза медленнее.

Он сравнивает цикл for и список LINQ (и любую структуру, которую он использует внутри). В любом случае, он преобразует результат в массив (необходимо, чтобы заставить LINQ перестать быть "ленивым" ). Обе версии повторяются:

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Linq;

public class Evens
{
    private static readonly int[] numbers = new int[]{0, 1, 2, 3, 4, 5, 6, 7, 8, 9};

    private static int MAX_REPS = 1000000;

    public static void Main()
    {
        Stopwatch watch = new Stopwatch();

        watch.Start();
        for(int reps = 0; reps < MAX_REPS; reps++)
        {
            List<int> list = new List<int>(); // This could be optimized with a default size, but we'll skip that.
            for(int i = 0; i < numbers.Length; i++)
            {
                int number = numbers[i];
                if(number % 2 == 0)
                    list.Add(number);
            }
            int[] evensArray = list.ToArray();
        }
        watch.Stop();
        Console.WriteLine("Time for {0} for loop reps: {1}", MAX_REPS, watch.Elapsed);

        watch.Reset();
        watch.Start();
        for(int reps = 0; reps < MAX_REPS; reps++)
        {
            var evens = from num in numbers where num % 2 == 0 select num;
            int[] evensArray = evens.ToArray();
        }
        watch.Stop();
        Console.WriteLine("Time for {0} LINQ reps: {1}", MAX_REPS, watch.Elapsed);
    }
}

Прошлые тесты производительности для подобных задач (например, LINQ vs Loop - тест производительности) подтверждают это.

Ответ 2

Вы можете упростить код далее

var evens = Enumerable.Range(0, 10).Where(n => n % 2 == 0);

Одно из преимуществ этой формы заключается в том, что выполнение этого выражения откладывается до тех пор, пока evens не повторится (foreach(var n in evens) { ... }). Вышеприведенный оператор просто сообщает компилятору понять, как перечислить четные числа от 0 до 10, но не выполнять эту идею до тех пор, пока это не будет необходимо.

Ответ 3

LINQ работает по-разному для разных типов данных. Вы кормите его объектами, поэтому используете LINQ-to-objects. Это преобразуется в код, похожий на простой для цикла.

Но LINQ поддерживает различные типы данных. Например, если у вас была таблица db с именем 'numbers', LINQ-to-SQL перевела бы тот же запрос,

var evens = from num in numbers where num % 2 == 0 select num;

в SQL:

select num from numbers where num % 2 = 0

а затем выполняет это. Обратите внимание, что фильтрация не выполняется путем создания цикла for с внутренним блоком if; предложение 'where' изменяет запрос, отправленный на сервер базы данных. Перевод от запроса к исполняемому коду зависит от типа данных, которые вы его подаете.

Итак, LINQ - это не просто синтаксический сахар для for-loops, а гораздо более привлекательная система для "компиляции" запросов. Для получения дополнительной информации выполните поиск Linq Provider. Это такие компоненты, как linq-to-objects и linq-to-xml, и вы можете писать свои собственные, если вы чувствуете себя храбрыми.

Ответ 4

В приведенном выше коде у вас есть запрос Linq, который циклически переплетается над IEnumerable, так же как и цикл foreach. Тем не менее, в вашем коде есть LOT, идущий под капотом. Для foreach, вероятно, намного эффективнее, если вы намерены написать высокопроизводительный цикл. Linq предназначен для другой цели (общий доступ к данным).

Интерфейс IEnumerable предоставляет метод итератора, который затем непрерывно вызывается конструкцией цикла, как запрос foreach или Linq. Итератор возвращает следующий элемент в коллекции каждый раз, когда он вызывается.