Почему возникает проблема с кодировкой строки "\ xE2" от ASCII-8BIT до UTF-8?

Я пытаюсь загрузить PDF файл из электронной почты и записать содержимое в файл. По какой-то причине я получаю эту ошибку:

An Encoding::UndefinedConversionError occurred in attachments#inbound: "\xE2" from ASCII-8BIT to UTF-8 app/controllers/api/attachments_controller.rb:70:in `write'

Здесь мой код:

def inbound
    if Rails.env.production? or Rails.env.staging?
      email = Postmark::Mitt.new(request.body.read)
    else
      email = Postmark::Mitt.new(File.binread "#{Rails.root}/app/temp_pdfs/email.json")
    end

    if email.attachments.count == 0
      # notify aidin that we got an inbound email with no attachments
      respond_to do |format|
        format.json { head :no_content }
      end
      return
    end
    attachment = email.attachments.first
    filename = "attachment" + (Time.now.strftime("%Y%m%d%H%M%S")+(rand * 1000000).round.to_s) + ".pdf"
    base_path = "#{Rails.root}/temp_attachments/"
    unless File.directory?(base_path)
      Dir::mkdir(base_path)
    end
    file = File.new base_path + filename, 'w+'
    file.write Base64.decode64(attachment.source['Content'].encode("UTF-16BE", :invalid=>:replace, :replace=>"?").encode("UTF-8"))
    file.close
    write_options = write_options()
    write_options[:metadata] = {:filename => attachment.file_name, :content_type => attachment.content_type, :size => attachment.size }

    obj = s3_object()
    file = File.open file.path
    obj.write(file.read, write_options)
    file.close

    FaxAttach.trigger obj.key.split('/').last

    render :nothing => true, :status => 202 and return
  end

Я читал, и это выглядело так, как это можно было решить:

file.write Base64.decode64(attachment.source['Content'].encode("UTF-16BE", :invalid=>:replace, :replace=>"?").encode("UTF-8"))

но он не работает.

Ответ 1

Сообщение об ошибке на самом деле бросается на запись файла, а не на ваше кодирование/декодирование внутри параметров, поскольку Ruby пытается применить кодировку символов по умолчанию на file.write. Чтобы предотвратить это, самым быстрым решением является добавление флага b при открытии файла

file = File.new base_path + filename, 'wb+'
file.write Base64.decode64( attachment.source['Content'] )

Предположим, что входящее вложение закодировано в Base64, поскольку ваш код подразумевает (я не могу проверить это). Кодировка Base64, хранящаяся внутри attachment.source['Content'], должна быть одинаковыми байтами в ASCII-8BIT и UTF-8, поэтому нет смысла преобразовывать ее в вызов decode64.