Вот вопрос.
Учитывая URL-адрес http://www.example.com, можем ли мы прочитать первые N байтов на странице?
- используя wget, мы можем загрузить всю страницу.
-
используя curl, существует -r, 0-499 определяет первые 500 байтов. Кажется, проблема решена.
Вы также должны знать, что на многих серверах HTTP/1.1 эта функция не включена, поэтому, когда вы пытаетесь получить диапазон, вместо этого вы получите весь документ.
-
используя urlib в python. аналогичный вопрос здесь, но, по словам Константина, это действительно так?
В прошлый раз, когда я пробовал эту технику, это провалилось, потому что на самом деле невозможно было прочитать с HTTP-сервера только указанный объем данных, т.е. Вы неявно прочитали весь HTTP-ответ и только затем прочитали из него первые N байтов. Итак, в конце концов вы загрузили весь 1Gb злонамеренный ответ.
Таким образом, проблема в том, как мы можем на первый взгляд прочитать первые N байтов с HTTP-сервера?
С уважением и благодарностью