Как проверить тип файла MIME с javascript перед загрузкой?

Я прочитал этот и этот вопрос, который, кажется, предполагает, что файл MIME-типа можно проверить используя javascript на стороне клиента. Теперь я понимаю, что реальная проверка еще должна выполняться на стороне сервера. Я хочу выполнить проверку на стороне клиента, чтобы избежать ненужной потери ресурсов сервера.

Чтобы проверить, можно ли это сделать на стороне клиента, я изменил расширение тестового файла JPEG на .png и выберет файл для загрузки. Перед отправкой файла я запрашиваю объект файла с помощью консоли javascript:

document.getElementsByTagName('input')[0].files[0];

Это то, что я получаю в Chrome 28.0:

Файл {webkitRelativePath: ", lastModifiedDate: Вт Окт 16 2012 10:00:00 GMT + 0000 (UTC), имя:" test.png ", введите:" image/png", размер: 500055...}

Показывает тип image/png, который указывает, что проверка выполняется на основе расширения файла вместо типа MIME. Я пробовал Firefox 22.0, и это дает мне тот же результат. Но согласно спецификация W3C, MIME Sniffing должно быть реализовано.

Можно ли сказать, что нет способа проверить тип MIME с javascript на данный момент? Или я что-то упускаю?

Ответ 1

Вы можете легко определить файл MIME-типа с помощью JavaScript FileReader перед его загрузкой на сервер. Я согласен с тем, что мы предпочитаем проверять серверную сторону на стороне клиента, но проверка на стороне клиента по-прежнему возможна. Я покажу вам, как и дайте рабочую демонстрацию внизу.


Убедитесь, что ваш браузер поддерживает как File и Blob. Все основные должны.

if (window.FileReader && window.Blob) {
    // All the File APIs are supported.
} else {
    // File and Blob are not supported
}

Шаг 1:

Вы можете получить информацию о File из элемента <input> как это (ref):

<input type="file" id="your-files" multiple>
<script>
var control = document.getElementById("your-files");
control.addEventListener("change", function(event) {
    // When the control has changed, there are new files
    var files = control.files,
    for (var i = 0; i < files.length; i++) {
        console.log("Filename: " + files[i].name);
        console.log("Type: " + files[i].type);
        console.log("Size: " + files[i].size + " bytes");
    }
}, false);
</script>

Ниже приведена версия перетаскивания (ref):

<div id="your-files"></div>
<script>
var target = document.getElementById("your-files");
target.addEventListener("dragover", function(event) {
    event.preventDefault();
}, false);

target.addEventListener("drop", function(event) {
    // Cancel default actions
    event.preventDefault();
    var files = event.dataTransfer.files,
    for (var i = 0; i < files.length; i++) {
        console.log("Filename: " + files[i].name);
        console.log("Type: " + files[i].type);
        console.log("Size: " + files[i].size + " bytes");
    }
}, false);
</script>

Шаг 2:

Теперь мы можем проверять файлы и дразнить заголовки и типы MIME.

✘ Быстрый метод

Вы можете наивно спросить Blob для типа MIME любого файла, который он представляет, используя этот шаблон:

var blob = files[i]; // See step 1 above
console.log(blob.type);

Для изображений типы MIME возвращаются следующим образом:

изображение /JPEG
Изображение /PNG
...

Предостережение: тип MIME определяется из расширения файла и может быть обманут или подделан. Можно переименовать .jpg в .png и тип MIME будет отображаться как image/png.


✓ Правильный метод проверки заголовка

Чтобы получить Bonafide MIME-тип клиентского файла, мы можем пойти дальше и проверить первые несколько байтов данного файла для сравнения с так называемыми магическими числами. Будьте предупреждены, что это не совсем просто, потому что, например, JPEG имеет несколько "волшебных чисел". Это связано с тем, что формат развивается с 1991 года. Вы можете уйти с проверкой только первых двух байтов, но я предпочитаю проверять не менее 4 байтов для уменьшения ложных срабатываний.

Примеры файлов подписи JPEG (первые 4 байта):

FF D8 FF E0 (SOI + ADD0)
FF D8 FF E1 (SOI + ADD1)
FF D8 FF E2 (SOI + ADD2)

Вот необходимый код для извлечения заголовка файла:

var blob = files[i]; // See step 1 above
var fileReader = new FileReader();
fileReader.onloadend = function(e) {
  var arr = (new Uint8Array(e.target.result)).subarray(0, 4);
  var header = "";
  for(var i = 0; i < arr.length; i++) {
     header += arr[i].toString(16);
  }
  console.log(header);

  // Check the file signature against known types

};
fileReader.readAsArrayBuffer(blob);

Затем вы можете определить настоящий MIME-тип (более подписи файлов здесь и здесь):

switch (header) {
    case "89504e47":
        type = "image/png";
        break;
    case "47494638":
        type = "image/gif";
        break;
    case "ffd8ffe0":
    case "ffd8ffe1":
    case "ffd8ffe2":
    case "ffd8ffe3":
    case "ffd8ffe8":
        type = "image/jpeg";
        break;
    default:
        type = "unknown"; // Or you can use the blob.type as fallback
        break;
}

Принять или отклонить загрузку файлов, как вам нравится, на основе ожидаемых типов MIME.


демонстрация

Вот рабочая демонстрация для локальных файлов и удаленных файлов (мне пришлось обойти CORS только для этой демонстрации). Откройте фрагмент, запустите его, и вы увидите три удаленных изображения разных типов. В верхней части вы можете выбрать локальное изображение или файл данных, и будет отображаться подпись файла и/или тип MIME.

Обратите внимание, что даже если изображение будет переименовано, можно определить его истинный тип MIME. Увидеть ниже.

Скриншот

Expected output of demo


// Return the first few bytes of the file as a hex string
function getBLOBFileHeader(url, blob, callback) {
  var fileReader = new FileReader();
  fileReader.onloadend = function(e) {
    var arr = (new Uint8Array(e.target.result)).subarray(0, 4);
    var header = "";
    for (var i = 0; i < arr.length; i++) {
      header += arr[i].toString(16);
    }
    callback(url, header);
  };
  fileReader.readAsArrayBuffer(blob);
}

function getRemoteFileHeader(url, callback) {
  var xhr = new XMLHttpRequest();
  // Bypass CORS for this demo - naughty, Drakes
  xhr.open('GET', '//cors-anywhere.herokuapp.com/' + url);
  xhr.responseType = "blob";
  xhr.onload = function() {
    callback(url, xhr.response);
  };
  xhr.onerror = function() {
    alert('A network error occurred!');
  };
  xhr.send();
}

function headerCallback(url, headerString) {
  printHeaderInfo(url, headerString);
}

function remoteCallback(url, blob) {
  printImage(blob);
  getBLOBFileHeader(url, blob, headerCallback);
}

function printImage(blob) {
  // Add this image to the document body for proof of GET success
  var fr = new FileReader();
  fr.onloadend = function() {
    $("hr").after($("<img>").attr("src", fr.result))
      .after($("<div>").text("Blob MIME type: " + blob.type));
  };
  fr.readAsDataURL(blob);
}

// Add more from http://en.wikipedia.org/wiki/List_of_file_signatures
function mimeType(headerString) {
  switch (headerString) {
    case "89504e47":
      type = "image/png";
      break;
    case "47494638":
      type = "image/gif";
      break;
    case "ffd8ffe0":
    case "ffd8ffe1":
    case "ffd8ffe2":
      type = "image/jpeg";
      break;
    default:
      type = "unknown";
      break;
  }
  return type;
}

function printHeaderInfo(url, headerString) {
  $("hr").after($("<div>").text("Real MIME type: " + mimeType(headerString)))
    .after($("<div>").text("File header: 0x" + headerString))
    .after($("<div>").text(url));
}

/* Demo driver code */

var imageURLsArray = ["http://media2.giphy.com/media/8KrhxtEsrdhD2/giphy.gif", "http://upload.wikimedia.org/wikipedia/commons/e/e9/Felis_silvestris_silvestris_small_gradual_decrease_of_quality.png", "http://static.giantbomb.com/uploads/scale_small/0/316/520157-apple_logo_dec07.jpg"];

// Check for FileReader support
if (window.FileReader && window.Blob) {
  // Load all the remote images from the urls array
  for (var i = 0; i < imageURLsArray.length; i++) {
    getRemoteFileHeader(imageURLsArray[i], remoteCallback);
  }

  /* Handle local files */
  $("input").on('change', function(event) {
    var file = event.target.files[0];
    if (file.size >= 2 * 1024 * 1024) {
      alert("File size must be at most 2MB");
      return;
    }
    remoteCallback(escape(file.name), file);
  });

} else {
  // File and Blob are not supported
  $("hr").after( $("<div>").text("It seems your browser doesn't support FileReader") );
} /* Drakes, 2015 */
img {
  max-height: 200px
}
div {
  height: 26px;
  font: Arial;
  font-size: 12pt
}
form {
  height: 40px;
}
<script src="https://ajax.googleapis.com/ajax/libs/jquery/1.9.1/jquery.min.js"></script>
<form>
  <input type="file" />
  <div>Choose an image to see its file signature.</div>
</form>
<hr/>

Ответ 2

Как указано в других ответах, вы можете проверить тип mime, проверив подпись файла в первых байтах файла.

Но другие ответы - это загрузка всего файла в память, чтобы проверить подпись, которая очень расточительна и может легко заморозить ваш браузер, если вы выбрали большой файл случайно или нет.

/**
 * Load the mime type based on the signature of the first bytes of the file
 * @param  {File}   file        A instance of File
 * @param  {Function} callback  Callback with the result
 * @author Victor www.vitim.us
 * @date   2017-03-23
 */
function loadMime(file, callback) {
    
    //List of known mimes
    var mimes = [
        {
            mime: 'image/jpeg',
            pattern: [0xFF, 0xD8, 0xFF],
            mask: [0xFF, 0xFF, 0xFF],
        },
        {
            mime: 'image/png',
            pattern: [0x89, 0x50, 0x4E, 0x47],
            mask: [0xFF, 0xFF, 0xFF, 0xFF],
        }
        // you can expand this list @see https://mimesniff.spec.whatwg.org/#matching-an-image-type-pattern
    ];

    function check(bytes, mime) {
        for (var i = 0, l = mime.mask.length; i < l; ++i) {
            if ((bytes[i] & mime.mask[i]) - mime.pattern[i] !== 0) {
                return false;
            }
        }
        return true;
    }

    var blob = file.slice(0, 4); //read the first 4 bytes of the file

    var reader = new FileReader();
    reader.onloadend = function(e) {
        if (e.target.readyState === FileReader.DONE) {
            var bytes = new Uint8Array(e.target.result);

            for (var i=0, l = mimes.length; i<l; ++i) {
                if (check(bytes, mimes[i])) return callback("Mime: " + mimes[i].mime + " <br> Browser:" + file.type);
            }

            return callback("Mime: unknown <br> Browser:" + file.type);
        }
    };
    reader.readAsArrayBuffer(blob);
}


//when selecting a file on the input
fileInput.onchange = function() {
    loadMime(fileInput.files[0], function(mime) {

        //print the output to the screen
        output.innerHTML = mime;
    });
};
<input type="file" id="fileInput">
<div id="output"></div>

Ответ 3

Если вы просто хотите проверить, является ли загруженный файл изображением, вы можете просто загрузить его в тег <img> для проверки любого обратного вызова ошибки.

Пример:

var input = document.getElementsByTagName('input')[0];
var reader = new FileReader();

reader.onload = function (e) {
    imageExists(e.target.result, function(exists){
        if (exists) {

            // Do something with the image file.. 

        } else {

            // different file format

        }
    });
};

reader.readAsDataURL(input.files[0]);


function imageExists(url, callback) {
    var img = new Image();
    img.onload = function() { callback(true); };
    img.onerror = function() { callback(false); };
    img.src = url;
}

Ответ 4

Как говорит Дрейк, это можно сделать с помощью FileReader. Однако то, что я здесь представляю, является функциональной версией. Примите во внимание, что большая проблема с этим с помощью JavaScript заключается в reset входном файле. Ну, это ограничивает только JPG (для других форматов вам придется изменить тип mime и магический номер):

<form id="form-id">
  <input type="file" id="input-id" accept="image/jpeg"/>
</form>

<script type="text/javascript">
    $(function(){
        $("#input-id").on('change', function(event) {
            var file = event.target.files[0];
            if(file.size>=2*1024*1024) {
                alert("JPG images of maximum 2MB");
                $("#form-id").get(0).reset(); //the tricky part is to "empty" the input file here I reset the form.
                return;
            }

            if(!file.type.match('image/jp.*')) {
                alert("only JPG images");
                $("#form-id").get(0).reset(); //the tricky part is to "empty" the input file here I reset the form.
                return;
            }

            var fileReader = new FileReader();
            fileReader.onload = function(e) {
                var int32View = new Uint8Array(e.target.result);
                //verify the magic number
                // for JPG is 0xFF 0xD8 0xFF 0xE0 (see https://en.wikipedia.org/wiki/List_of_file_signatures)
                if(int32View.length>4 && int32View[0]==0xFF && int32View[1]==0xD8 && int32View[2]==0xFF && int32View[3]==0xE0) {
                    alert("ok!");
                } else {
                    alert("only valid JPG images");
                    $("#form-id").get(0).reset(); //the tricky part is to "empty" the input file here I reset the form.
                    return;
                }
            };
            fileReader.readAsArrayBuffer(file);
        });
    });
</script>

Учитывайте, что это было протестировано в последних версиях Firefox и Chrome, а также на IExplore 10.

Полный список типов mime см. в Википедии.

Полный список магического номера см. в Википедии.

Ответ 5

Короткий ответ - нет.

Как вы заметили, браузеры получают type из расширения файла. Предварительный просмотр Mac также, похоже, отключает расширение. Я предполагаю, потому что его более быстрое чтение имени файла, содержащегося в указателе, вместо поиска и чтения файла на диске.

Я сделал копию jpg, переименованного в png.

Я смог последовательно получать следующее из обоих изображений в хром (должен работать в современных браузерах).

ÿØÿàJFIFÿþ;CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), quality = 90

Что вы могли бы выбить проверку String.indexOf('jpeg') для типа изображения.

Вот скрипка для изучения http://jsfiddle.net/bamboo/jkZ2v/1/

Удивительная строка, которую я забыл прокомментировать в примере

console.log( /^(.*)$/m.exec(window.atob( image.src.split(',')[1] )) );

  • Разделяет данные img с кодировкой base64, оставляя на изображении
  • Base64 декодирует изображение
  • Совпадает только с первой строкой данных изображения

Код скрипта использует base64-декодирование, которое не работает в IE9, я нашел хороший пример с использованием VB script, который работает в IE http://blog.nihilogic.dk/2008/08/imageinfo-reading-image-metadata-with.html

Код для загрузки изображения был взят из Joel Vardy, который делает некоторые интересные изображения, изменяя размер клиентской стороны перед загрузкой, которая может представлять интерес https://joelvardy.com/writing/javascript-image-upload

Ответ 6

Вот расширение ответа Roberto14, которое делает следующее:

ЭТО ТОЛЬКО ПОЗВОЛЯЕТ ИЗОБРАЖЕНИЯ

Проверяет, доступен ли FileReader и возвращается ли проверка на расширение, если он недоступен.

Дает предупреждение об ошибке, если не изображение

Если это изображение, оно загружает предварительный просмотр

** Вы все равно должны проверять на стороне сервера, это больше удобство для конечного пользователя, чем что-либо еще. Но это удобно!

<form id="myform">
    <input type="file" id="myimage" onchange="readURL(this)" />
    <img id="preview" src="#" alt="Image Preview" />
</form>

<script>
function readURL(input) {
    if (window.FileReader && window.Blob) {
        if (input.files && input.files[0]) {
            var reader = new FileReader();
            reader.onload = function (e) {
                var img = new Image();
                img.onload = function() {
                    var preview = document.getElementById('preview');
                    preview.src = e.target.result;
                    };
                img.onerror = function() { 
                    alert('error');
                    input.value = '';
                    };
                img.src = e.target.result;
                }
            reader.readAsDataURL(input.files[0]);
            }
        }
    else {
        var ext = input.value.split('.');
        ext = ext[ext.length-1].toLowerCase();      
        var arrayExtensions = ['jpg' , 'jpeg', 'png', 'bmp', 'gif'];
        if (arrayExtensions.lastIndexOf(ext) == -1) {
            alert('error');
            input.value = '';
            }
        else {
            var preview = document.getElementById('preview');
            preview.setAttribute('alt', 'Browser does not support preview.');
            }
        }
    }
</script>

Ответ 7

Это то, что вам нужно сделать

var fileVariable =document.getElementsById('fileId').files[0];

Если вы хотите проверить типы файлов изображений, то

if(fileVariable.type.match('image.*'))
{
 alert('its an image');
}