Какая разница между разделом и сегментом в формате файлов ELF

Из wiki Исполняемый и связанный формат:

В сегментах содержится информация, необходимая для выполнения файла во время выполнения, а разделы содержат важные данные для компоновки и перемещения. Любой байт во всем файле может принадлежать не более чем одному разделу, и могут быть сироты, которые не принадлежат ни одному разделу.

Но какая разница между секцией и сегментом? В исполняемом файле ELF сегмент содержит один или несколько разделов?

Ответ 1

Но какая разница между разделом и сегментом?

Именно то, что вы цитировали: сегменты содержат информацию, необходимую во время выполнения, в то время как разделы содержат информацию, необходимую при связывании.

содержит ли сегмент один или несколько разделов?

Сегмент может содержать 0 или более разделов. Пример:

readelf -l /bin/date

Elf file type is EXEC (Executable file)
Entry point 0x402000
There are 9 program headers, starting at offset 64

Program Headers:
  Type           Offset             VirtAddr           PhysAddr
                 FileSiz            MemSiz              Flags  Align
  PHDR           0x0000000000000040 0x0000000000400040 0x0000000000400040
                 0x00000000000001f8 0x00000000000001f8  R E    8
  INTERP         0x0000000000000238 0x0000000000400238 0x0000000000400238
                 0x000000000000001c 0x000000000000001c  R      1
      [Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
  LOAD           0x0000000000000000 0x0000000000400000 0x0000000000400000
                 0x000000000000d5ac 0x000000000000d5ac  R E    200000
  LOAD           0x000000000000de10 0x000000000060de10 0x000000000060de10
                 0x0000000000000440 0x0000000000000610  RW     200000
  DYNAMIC        0x000000000000de38 0x000000000060de38 0x000000000060de38
                 0x00000000000001a0 0x00000000000001a0  RW     8
  NOTE           0x0000000000000254 0x0000000000400254 0x0000000000400254
                 0x0000000000000044 0x0000000000000044  R      4
  GNU_EH_FRAME   0x000000000000c700 0x000000000040c700 0x000000000040c700
                 0x00000000000002a4 0x00000000000002a4  R      4
  GNU_STACK      0x0000000000000000 0x0000000000000000 0x0000000000000000
                 0x0000000000000000 0x0000000000000000  RW     8
  GNU_RELRO      0x000000000000de10 0x000000000060de10 0x000000000060de10
                 0x00000000000001f0 0x00000000000001f0  R      1

 Section to Segment mapping:
  Segment Sections...
   00     
   01     .interp 
   02     .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame 
   03     .ctors .dtors .jcr .dynamic .got .got.plt .data .bss 
   04     .dynamic 
   05     .note.ABI-tag .note.gnu.build-id 
   06     .eh_frame_hdr 
   07     
   08     .ctors .dtors .jcr .dynamic .got 

Здесь сегмент PHDR содержит 0 разделов, сегмент INTERP содержит раздел .interp, а первый сегмент LOAD содержит целую кучу разделов.

Дальнейшее чтение с приятной иллюстрацией.

Ответ 2

Раздел содержит статические данные для компоновщика, сегментные динамические данные для ОС

Цитата правильная, но для того, чтобы понять ее разницу, вы должны попытаться понять поля заголовков заголовка раздела и заголовка (сегмента) программы и как они будут использоваться компоновщиком (разделами) и операционной системой (сегмент).

Особенно важная информация (кроме длин):

  • : сообщите компоновщику, есть ли раздел:

    • необработанные данные для загрузки в память, например. .data, .text и т.д.
    • или отформатированные метаданные о других разделах, которые будут использоваться компоновщиком, но исчезнут во время выполнения, например. .symtab, .srttab, .rela.text
  • сегмент: сообщает операционной системе:

    • где должен быть загружен сегмент в виртуальную память
    • какие разрешения имеют сегменты (чтение, запись, выполнение). Помните, что это может быть эффективно реализовано процессором: Как работает подкачка x86?

Я написал учебник, который более подробно описывает это: http://www.cirosantilli.com/elf-hello-world/

Сегмент содержит один или несколько разделов?

Да, и это компоновщик, который помещает разделы в сегменты.

В Binutils, как разделы помещаются в сегменты ld, определяется текстовым файлом, называемым компоновщиком script. Документы: https://sourceware.org/binutils/docs/ld/Scripts.html

Вы можете получить значение по умолчанию с ld --verbose и установить пользовательский с -T.

Например, мой компоновщик Ubuntu 17.04 по умолчанию script содержит:

  .text           :                                                                                                                                                             
  {                                                                                                                                                                             
    *(.text.unlikely .text.*_unlikely .text.unlikely.*)                                                                                                                         
    *(.text.exit .text.exit.*)                                                                                                                                                  
    *(.text.startup .text.startup.*)                                                                                                                                            
    *(.text.hot .text.hot.*)                                                                                                                                                    
    *(.text .stub .text.* .gnu.linkonce.t.*)                                                                                                                                                                                                                                                                                               
  } 

который сообщает компоновщику, что разделы .text.unlikely, .text.*_unlikely, .text.exit и т.д. в разделе .text помещаются как .text.

Разработка ОС - это случай, когда пользовательские сценарии полезны, минимальный пример: https://github.com/cirosantilli/x86-bare-metal-examples/blob/d217b180be4220a0b4a453f31275d38e697a99e0/linker.ld

Как только исполняемый файл связан, можно только узнать, какой раздел отправился на какой сегмент, если компоновщик сохраняет необязательный заголовок раздела в исполняемом файле: Где находится раздел "сегментное отображение" хранится в файлах ELF?