(сборка x86_64 linux) Почему printf с строкой формата float работает только с rsp% 0x10 = 0

У меня проблема с записью вызова printf на ассемблере x86_64 linux. Если я попытаюсь напечатать двойное значение, когда rsp % 0x10 != 0, printf выпадет с segfault.

Посмотрите на мой код (синтаксис nasm):

[bits 64]
global _start
extern printf
extern pow

section .data
    printf_format db '%lf', 10, 0
section .text
    _start:
    mov rbp, rsp
    sub rsp, MEM_VAL

    mov rax, 0x4000000000000000
    mov qword [rsp], rax

    movsd xmm0, qword [rsp]
    mov rdi, printf_format
    mov rax, 1
    call printf

    mov rax, 60
    mov rdi, 0
    syscall

Если MEM_VAL = 0x10, 0x20, ... , 0x100, ... все хорошо. Работа с кодом. Но с другим кодом значения с segfault. Зачем?

Я компилирую и связываю с этим:

nasm -f elf64 ex.asm
ld -lc -lm -m elf_x86_64 -I/lib/ld-linux-x86-64.so.2 ex.o -o ex

Воспользовавшись этой возможностью, я спрошу вас, где я могу прочитать спецификацию для вызова вызова C в x86_64 linux? Я знаю, что это fastcall, но я не понимаю такой тонкости.