Оператор Rx для различных последовательностей

ВАЖНО: для описания результатов и некоторых дополнительных деталей, пожалуйста, посмотрите также на мой ответ

Мне нужно сгруппировать и отфильтровать последовательность объектов/событий, которые обычно реплицируются, буферизуя их интервалом TimeSpan. Я пытаюсь объяснить это лучше с помощью мраморных диаграмм:

X-X-X-X-X-Y-Y-Y-Z-Z-Z-Z-X-X-Y-Z-Z

создаст

X---Y---Z---X---Y---Z

где X, Y и Z - разные типы событий, а "---" означает интервал. Кроме того, я хотел бы также отличить ключевое свойство, что он доступен для всех типов, потому что у них есть общий базовый класс:

X, Y, Z : A

и A содержит ключ свойства. Используя обозначение X.a, то есть X.Key = a, Окончательный образец будет:

X.a-X.b-X.a-Y.b-Y.c-Z.a-Z.a-Z.c-Z.b-Z.c

создаст

X.a-X.b---Y.b-Y.c-Z.a-Z.c-Z.b

Может ли кто-нибудь помочь мне собрать необходимые операторы Linq (возможно, DistinctUntilChanged и Buffer), чтобы добиться такого поведения? Благодаря

ОБНОВЛЕНИЕ 18.08.12:

по просьбе, я пытаюсь дать лучшее объяснение. У нас есть устройства, которые собирают и отправляют события в веб-службу. Эти устройства имеют старую логику (и мы не можем ее изменить из-за обратной совместимости), и они непрерывно отправляют событие, пока не получат подтверждение; после подтверждения они отправляют следующее событие в свою очередь и т.д. События содержат сетевой адрес устройства и некоторые другие свойства, отличающие события в очереди для каждого устройства. Событие выглядит следующим образом:

class Event
{
    public string NetworkAddress { get; }

    public string EventCode { get; }

    public string AdditionalAttribute { get; }
}

Цель состоит в том, чтобы обрабатывать каждые 5 секунд выдающиеся события, полученные от всех устройств, хранить информацию в базе данных (почему мы не хотим делать это партиями) и отправлять ack на устройство. Давайте сделаем пример с двумя устройствами и несколькими событиями:

Device 'a':
Event 1 (a1): NetworkAddress = '1', EventCode = A, AdditionalAttribute = 'x'
Event 2 (a2): NetworkAddress = '1', EventCode = A, AdditionalAttribute = 'y'
Event 3 (a3): NetworkAddress = '1', EventCode = B, AdditionalAttribute = 'x'

Device 'b':
Event 1 (b1): NetworkAddress = '2', EventCode = A, AdditionalAttribute = 'y'
Event 2 (b2): NetworkAddress = '2', EventCode = B, AdditionalAttribute = 'x'
Event 3 (b3): NetworkAddress = '2', EventCode = B, AdditionalAttribute = 'y'
Event 4 (b4): NetworkAddress = '2', EventCode = C, AdditionalAttribute = 'x'

Pn are the operations done by our server, explained later

Возможная мраморная диаграмма (входные потоки + выходной поток):

Device 'a'          : -[a1]-[a1]-[a1]----------------[a2]-[a2]-[a2]-[a3]-[a3]-[a3]-...
Device 'b'          : ------[b1]-[b1]-[b2]-[b2]-[b2]------[b3]-[b3]-[b4]-[b4]-[b4]-...

Time                : ------------[1s]-----------[2s]------------[3s]------------[4s]-
DB/acks (rx output) : ------------[P1]-----------[P2]------------[P3]------------[P4]-

P1: Server stores and acknowledges [a1] and [b1]
P2: "      "      "   "            [b2]
P3: "      "      "   "            [a2] and [b3]
P4: "      "      "   "            [a3] and [b4]

В конце я думаю, что это, вероятно, простая комбинация основных операторов, но я новичок в Rx, и я немного смущен, так как кажется, что есть много операторов (или комбинаций операторов), чтобы получить тот же выходной поток.

Обновление 19.08.12:

Пожалуйста, имейте в виду, что этот код работает на сервере, и он должен работать в течение нескольких дней без утечек памяти... Я не уверен в поведении предметов. На данный момент для каждого события я вызываю операцию push на службе, которая вызывает OnNext объекта, поверх которого я должен построить запрос (если я не ошибаюсь в отношении использования предметов).

Обновление 20.08.12:

Текущая реализация, включая проверку достоверности; это то, что я пробовал, и это похоже на предложение @yamen

public interface IEventService
{
    // Persists the events
    void Add(IEnumerable<Event> events);
}

public class Event
{
    public string Description { get; set; }
}

/// <summary>
/// Implements the logic to handle events.
/// </summary>
public class EventManager : IDisposable
{
    private static readonly TimeSpan EventHandlingPeriod = TimeSpan.FromSeconds(5);

    private readonly Subject<EventMessage> subject = new Subject<EventMessage>();

    private readonly IDisposable subscription;

    private readonly object locker = new object();

    private readonly IEventService eventService;

    /// <summary>
    /// Initializes a new instance of the <see cref="EventManager"/> class.
    /// </summary>
    /// <param name="scheduler">The scheduler.</param>
    public EventManager(IEventService eventService, IScheduler scheduler)
    {
        this.eventService = eventService;
        this.subscription = this.CreateQuery(scheduler);
    }

    /// <summary>
    /// Pushes the event.
    /// </summary>
    /// <param name="eventMessage">The event message.</param>
    public void PushEvent(EventMessage eventMessage)
    {
        Contract.Requires(eventMessage != null);
        this.subject.OnNext(eventMessage);
    }

    /// <summary>
    /// Performs application-defined tasks associated with freeing, releasing, or resetting unmanaged resources.
    /// </summary>
    /// <filterpriority>2</filterpriority>
    public void Dispose()
    {
        this.Dispose(true);
    }

    private void Dispose(bool disposing)
    {
        if (disposing)
        {
            // Dispose unmanaged resources
        }

        this.subject.Dispose();
        this.subscription.Dispose();
    }

    private IDisposable CreateQuery(IScheduler scheduler)
    {
        var buffered = this.subject
            .DistinctUntilChanged(new EventComparer())
            .Buffer(EventHandlingPeriod, scheduler);

        var query = buffered
            .Subscribe(this.HandleEvents);
        return query;
    }

    private void HandleEvents(IList<EventMessage> eventMessages)
    {
        Contract.Requires(eventMessages != null);
        var events = eventMessages.Select(this.SelectEvent);
        this.eventService.Add(events);
    }

    private Event SelectEvent(EventMessage message)
    {
        return new Event { Description = "evaluated description" };
    }

    private class EventComparer : IEqualityComparer<EventMessage>
    {
        public bool Equals(EventMessage x, EventMessage y)
        {
            return x.NetworkAddress == y.NetworkAddress && x.EventCode == y.EventCode && x.Attribute == y.Attribute;
        }

        public int GetHashCode(EventMessage obj)
        {
            var s = string.Concat(obj.NetworkAddress + "_" + obj.EventCode + "_" + obj.Attribute);
            return s.GetHashCode();
        }
    }
}

public class EventMessage
{
    public string NetworkAddress { get; set; }

    public byte EventCode { get; set; }

    public byte Attribute { get; set; }

    // Other properties
}

И тест:

public void PushEventTest()
    {
        const string Address1 = "A:2.1.1";
        const string Address2 = "A:2.1.2";

        var eventServiceMock = new Mock<IEventService>();

        var scheduler = new TestScheduler();
        var target = new EventManager(eventServiceMock.Object, scheduler);
        var eventMessageA1 = new EventMessage { NetworkAddress = Address1, EventCode = 1, Attribute = 4 };
        var eventMessageB1 = new EventMessage { NetworkAddress = Address2, EventCode = 1, Attribute = 5 };
        var eventMessageA2 = new EventMessage { NetworkAddress = Address1, EventCode = 1, Attribute = 4 };
        scheduler.Schedule(() => target.PushEvent(eventMessageA1));
        scheduler.Schedule(TimeSpan.FromSeconds(1), () => target.PushEvent(eventMessageB1));
        scheduler.Schedule(TimeSpan.FromSeconds(2), () => target.PushEvent(eventMessageA1));

        scheduler.AdvanceTo(TimeSpan.FromSeconds(6).Ticks);

        eventServiceMock.Verify(s => s.Add(It.Is<List<Event>>(list => list.Count == 2)), Times.Once());

        scheduler.Schedule(TimeSpan.FromSeconds(3), () => target.PushEvent(eventMessageB1));

        scheduler.AdvanceTo(TimeSpan.FromSeconds(11).Ticks);

        eventServiceMock.Verify(s => s.Add(It.Is<List<Event>>(list => list.Count == 1)), Times.Once());
    }

Кроме того, я снова отмечаю, что очень важно, чтобы программное обеспечение могло работать в течение нескольких дней без проблем, обрабатывая тысячи сообщений. Чтобы было ясно: тест не проходит с текущей реализацией.

Ответ 1

Я не уверен, делает ли это именно то, что вам бы хотелось, но вы можете группировать элементы явно с помощью ключевого слова group, а затем манипулировать различными IObservable отдельно перед их рекомбинацией.

например. если у нас есть определения классов, такие как

class A
{
    public char Key { get; set; }
}

class X : A { }
...

и a Subject<A>

Subject<A> subject = new Subject<A>();

то мы можем написать

var buffered =
    from a in subject
    group a by new { Type = a.GetType(), Key = a.Key } into g
    from buffer in g.Buffer(TimeSpan.FromMilliseconds(300))
    where buffer.Any()
    select new
    {
        Count = buffer.Count,
        Type = buffer.First().GetType().Name,
        Key = buffer.First().Key
    };

buffered.Do(Console.WriteLine).Subscribe();

Мы можем проверить это с предоставленными вами данными:

subject.OnNext(new X { Key = 'a' }); 
Thread.Sleep(100);
subject.OnNext(new X { Key = 'b' }); 
Thread.Sleep(100);
subject.OnNext(new X { Key = 'a' }); 
Thread.Sleep(100);
...
subject.OnCompleted();

Чтобы получить предоставленный вами вывод:

{ Count = 2, Type = X, Key = a }
{ Count = 1, Type = X, Key = b }
{ Count = 1, Type = Y, Key = b }
{ Count = 1, Type = Y, Key = c }
{ Count = 2, Type = Z, Key = a }
{ Count = 2, Type = Z, Key = c }
{ Count = 1, Type = Z, Key = b }

Ответ 2

Не уверен, что это именно то, что вы хотите, но, похоже, поддерживает ваши варианты использования.

Сначала давайте определим базовый класс (вы можете легко изменить его в соответствии с вашими потребностями):

public class MyEvent
{
    public string NetworkAddress { set; get; }
    public string EventCode { set; get; }
}

Позвольте настроить ваши устройства в виде массива IObservable<MyEvent> - вы можете использовать их по-разному, и ниже нужно будет изменить их, чтобы это соответствовало. Каждое из этих устройств производит произвольную задержку между 0,5 и 1,5 секундами.

var deviceA = new MyEvent[] { new MyEvent() {NetworkAddress = "A", EventCode = "1"},
                              new MyEvent() {NetworkAddress = "A", EventCode = "1"},
                              new MyEvent() {NetworkAddress = "A", EventCode = "2"} };

var deviceB = new MyEvent[] { new MyEvent() {NetworkAddress = "B", EventCode = "1"},
                              new MyEvent() {NetworkAddress = "B", EventCode = "2"},
                              new MyEvent() {NetworkAddress = "B", EventCode = "2"},
                              new MyEvent() {NetworkAddress = "B", EventCode = "3"} };   

var random = new Random();                                 

var deviceARand = deviceA.ToObservable().Select(a => Observable.Return(a).Delay(TimeSpan.FromMilliseconds(random.Next(500,1500)))).Concat();
var deviceBRand = deviceB.ToObservable().Select(b => Observable.Return(b).Delay(TimeSpan.FromMilliseconds(random.Next(500,1500)))).Concat();

var devices = new IObservable<MyEvent>[] { deviceARand, deviceBRand };

Теперь возьмите все эти отдельные потоки устройств, сделайте их "отличными" и объедините их в один основной поток:

var stream = devices.Aggregate(Observable.Empty<MyEvent>(), (acc, device) => acc.DistinctUntilChanged(a => a.EventCode).Merge(device));

Как только вы это сделаете, периодический прием этого потока - это просто буферизация его с помощью Buffer:

stream.Buffer(TimeSpan.FromSeconds(1)).Subscribe(x => { /* code here works on a list of the filtered events per second */ });

Ответ 3

После поиска и экспериментов я собрал код, который выводит результат, который я ожидаю:

static void Main(string[] args)
    {
        const string Address1 = "A:2.1.1";
        const string Address2 = "A:2.1.2";
        var comparer = new EventComparer();
        var eventMessageA1 = new EventMessage { NetworkAddress = Address1, EventCode = 1, Attribute = 4 };
        var eventMessageB1 = new EventMessage { NetworkAddress = Address2, EventCode = 1, Attribute = 5 };
        var eventMessageA2 = new EventMessage { NetworkAddress = Address1, EventCode = 1, Attribute = 5 };
        var list = new[] { eventMessageA1, eventMessageA1, eventMessageB1, eventMessageA2, eventMessageA1, eventMessageA1 };

        var queue = new BlockingCollection<EventMessage>();
        Observable.Interval(TimeSpan.FromSeconds(2)).Subscribe
            (
                l => list.ToList().ForEach(m =>
                {
                    Console.WriteLine("Producing {0} on thread {1}", m, Thread.CurrentThread.ManagedThreadId);
                    queue.Add(m);
                })
            );

        // subscribing
        queue.GetConsumingEnumerable()
            .ToObservable()
             .Buffer(TimeSpan.FromSeconds(5))
             .Subscribe(e =>
                 {
                     Console.WriteLine("Queue contains {0} items", queue.Count);
                     e.Distinct(comparer).ToList().ForEach(m =>
                  Console.WriteLine("{0} - Consuming: {1} (queue contains {2} items)", DateTime.UtcNow, m, queue.Count));
                 }
             );

        Console.WriteLine("Type enter to exit");
        Console.ReadLine();
    }

    public class EventComparer : IEqualityComparer<EventMessage>
    {
        public bool Equals(EventMessage x, EventMessage y)
        {
            var result = x.NetworkAddress == y.NetworkAddress && x.EventCode == y.EventCode && x.Attribute == y.Attribute;
            return result;
        }

        public int GetHashCode(EventMessage obj)
        {
            var s = string.Concat(obj.NetworkAddress + "_" + obj.EventCode + "_" + obj.Attribute);
            return s.GetHashCode();
        }
    }

    public class EventMessage
    {
        public string NetworkAddress { get; set; }

        public byte EventCode { get; set; }

        public byte Attribute { get; set; }

        public override string ToString()
        {
            const string Format = "{0} ({1}, {2})";
            var s = string.Format(Format, this.NetworkAddress, this.EventCode, this.Attribute);
            return s;
        }
    }

В любом случае, наблюдая за приложением, похоже, что это вызывает утечку памяти. Мой вопрос:

  • Что вызывает утечку памяти? [см. обновление ниже]
  • это лучший способ сделать это (если я положил выделение на первое наблюдаемое, я не получаю другие события в следующих буферах, но элементы в каждом буфере должны быть изолированы от других)?
  • как я могу написать тест, используя тестовый планировщик?

UPDATE

кажется, что приращение памяти длится всего несколько минут, тогда значение стабильно. Я проведу долгий тест. Конечно, это было бы абсолютно приемлемым поведением.

ОБНОВЛЕНИЕ 26.08.12:

  • как я уже упоминал в предыдущем обновлении, использование памяти увеличивается только (и медленно) в течение нескольких минут после запуска. Через 8 часов потребляемая память была стабильной, с нормальными колебаниями в диапазоне нескольких килобайт).
  • эта question очень похожа на мою, и предлагаемое расширение Drain может хорошо примениться к моей проблеме (все еще для проверки)

В любом случае, я думаю, что мой вопрос по-прежнему открыт для модульных тестов с использованием планировщика тестов.

спасибо Francesco