Недавно я столкнулся с интересной проблемой производительности TCP при выполнении некоторых тестов производительности, которые сравнивали производительность сети и производительность шлейфа. В моем случае производительность сети превышала производительность loopback (сеть 1Gig, одна и та же подсеть). В случае, когда я занимаюсь задержками, это имеет решающее значение, поэтому TCP_NODELAY включен. Лучшая теория, которую мы придумали, заключается в том, что контроль перегрузки TCP поддерживает пакеты. Мы провели анализ пакетов, и мы можем определенно увидеть, что пакеты хранятся, но причина не очевидна. Теперь вопросы...
1) В каких случаях и почему, если бы связь по шлейфу была медленнее, чем по сети?
2) При отправке как можно быстрее, почему переключение TCP_NODELAY оказывает гораздо большее влияние на максимальную пропускную способность по шлейфу, чем по сети?
3) Как мы можем обнаружить и проанализировать контроль перегрузки TCP как потенциальное объяснение низкой производительности?
4) Есть ли у кого-нибудь другие теории относительно причины этого явления? Если да, то какой метод доказать теорию?
Вот несколько примеров данных, сгенерированных простым приложением С++ для point to point:
Transport Message Size (bytes) TCP NoDelay Send Buffer (bytes) Sender Host Receiver Host Throughput (bytes/sec) Message Rate (msgs/sec) TCP 128 On 16777216 HostA HostB 118085994 922546 TCP 128 Off 16777216 HostA HostB 118072006 922437 TCP 128 On 4096 HostA HostB 11097417 86698 TCP 128 Off 4096 HostA HostB 62441935 487827 TCP 128 On 16777216 HostA HostA 20606417 160987 TCP 128 Off 16777216 HostA HostA 239580949 1871726 TCP 128 On 4096 HostA HostA 18053364 141041 TCP 128 Off 4096 HostA HostA 214148304 1673033 UnixStream 128 - 16777216 HostA HostA 89215454 696995 UnixDatagram 128 - 16777216 HostA HostA 41275468 322464 NamedPipe 128 - - HostA HostA 73488749 574130
Вот еще несколько полезных сведений:
- Я вижу эту проблему только с небольшими сообщения
- HostA и HostB имеют одинаковые аппаратный комплект (Xeon [email protected], 32 ядра всего /128 Gig Mem/1Gig Nics)
- ОС - это RHEL 5.4 kernel 2.6.18-164.2.1.el5)
Спасибо