Как прочитать заголовок Content Type и преобразовать его в utf-8, в то время как Gmail IMAP имеет utf8, а Outlook имеет ISO-8859-7?

Итак, я получаю письма с помощью imap из gmail и Outlook.

Gmail кодирует как =?UTF-8?B?UmU6IM69zq3OvyDOtc68zrHOuc67IG5ldyBlbWFpbA==?= и внешний вид кодируется следующим образом: =?iso-8859-7?B?UmU6IOXr6+ft6er8IHN1YmplY3Q=?=

К сожалению, я еще не нашел решения, которые помогут мне сделать это в читаемом тексте. Вместо этого я возился с:

mb_convert_encoding($body, "UTF-8", "UTF-8"); 

и

mb_convert_encoding($body, "UTF-8", "iso-8859-7");

но я изо всех сил пытаюсь найти решение для решения этого вопроса.

Вот как я открываю IMAP моей учетной записи (в которой много сообщений gmail и Outlook)

$hostname = '{imappro.zoho.com:993/imap/ssl}INBOX';
$username = '[email protected]';
$password = 'password';


/* try to connect */
$inbox = imap_open($hostname,$username ,$password) or die('Cannot connect to Zoho: ' . imap_last_error());

/* grab emails */
$emails = imap_search($inbox,'UNSEEN');

Любая помощь?

Ответ 1

К сожалению, я еще не нашел решения, которые помогут мне сделать это в читаемый текст.

Решение Ваши строки закодированы в base64.

=?UTF-8?B?UmU6IM69zq3OvyDOtc68zrHOuc67IG5ldyBlbWFpbA==?=

echo base64_decode('UmU6IM69zq3OvyDOtc68zrHOuc67IG5ldyBlbWFpbA==');

prints "Re: νέο εμαιλ new email"

=?iso-8859-7?B?UmU6IOXr6+ft6er8IHN1YmplY3Q=?=

echo base64_decode('UmU6IOXr6+ft6er8IHN1YmplY3Q=');

распечатывает "Re: subject"

Ответ заключается в использовании base64_decode в сочетании с вашими текущими решениями.

Способ идентификации кодированного текста base64 состоит в том, что он изображен как буквы a-z, A-Z, цифры 0-9 вместе с двумя другими символами (обычно + и /), и обычно он имеет право с помощью =.

EDIT:

Извините, я уже забыл, что вопрос состоял в том, чтобы конвертировать из iso-8859-7 в UTF-8 и видеть его.

<?php
$str = base64_decode('UmU6IPP03evt+SDs3u317OE=');
$str = mb_convert_encoding($str,'UTF-8','iso-8859-7');
echo $str;
?>

В результате получается "Re: στέλνω μήνυμα"

Ответ 2

посмотрите здесь

   /* connect to gmail */
    $hostname = '{imap.gmail.com:993/imap/ssl}INBOX';
    $username = '[email protected]';
    $password = 'davidwalsh';

    /* try to connect */
    $inbox = imap_open($hostname,$username,$password) or die('Cannot connect to Gmail: ' . imap_last_error());

    /* grab emails */
    $emails = imap_search($inbox,'ALL');

    /* if emails are returned, cycle through each... */
    if($emails) {

        /* begin output var */
        $output = '';

        /* put the newest emails on top */
        rsort($emails);

        /* for every email... */
        foreach($emails as $email_number) {

            /* get information specific to this email */
            $overview = imap_fetch_overview($inbox,$email_number,0);
            $message = imap_fetchbody($inbox,$email_number,2);

            /* output the email header information */
            $output.= '<div class="toggler '.($overview[0]->seen ? 'read' : 'unread').'">';
            $output.= '<span class="subject">'.$overview[0]->subject.'</span> ';
            $output.= '<span class="from">'.$overview[0]->from.'</span>';
            $output.= '<span class="date">on '.$overview[0]->date.'</span>';
            $output.= '</div>';

            /* output the email body */
            $output.= '<div class="body">'.$message.'</div>';
        }

        echo $output;
    } 

    /* close the connection */
    imap_close($inbox);

для чтения и декодирования смотрите здесь

<?php
$hostname = '{********:993/imap/ssl}INBOX';
$username = '*********';
$password = '******';

$inbox = imap_open($hostname,$username,$password) or die('Cannot connect to server: ' . imap_last_error());

$emails = imap_search($inbox,'ALL');

if($emails) {
    $output = '';
    rsort($emails);

    foreach($emails as $email_number) {
        $overview = imap_fetch_overview($inbox,$email_number,0);
        $structure = imap_fetchstructure($inbox, $email_number);

        if(isset($structure->parts) && is_array($structure->parts) && isset($structure->parts[1])) {
            $part = $structure->parts[1];
            $message = imap_fetchbody($inbox,$email_number,2);

            if($part->encoding == 3) {
                $message = imap_base64($message);
            } else if($part->encoding == 1) {
                $message = imap_8bit($message);
            } else {
                $message = imap_qprint($message);
            }
        }

        $output.= '<div class="toggle'.($overview[0]->seen ? 'read' : 'unread').'">';
        $output.= '<span class="from">From: '.utf8_decode(imap_utf8($overview[0]->from)).'</span>';
        $output.= '<span class="date">on '.utf8_decode(imap_utf8($overview[0]->date)).'</span>';
        $output.= '<br /><span class="subject">Subject('.$part->encoding.'): '.utf8_decode(imap_utf8($overview[0]->subject)).'</span> ';
        $output.= '</div>';

        $output.= '<div class="body">'.$message.'</div><hr />';
    }

    echo $output;
}

imap_close($inbox);
?>

Посмотрите здесь для большого учебника по структуре электронной почты и функции для его извлечения.

Ответ 3

Если вы хотите декодировать элементы заголовка, для него есть функция PHP: imap_mime_header_decode().

Кроме того, для декодирования многочастных сообщений вам понадобится некоторый класс парсеров MIME.

Ответ 4

Чтобы получить заголовки, вы передадите свой поток ($inbox) на imap_headers(). В ответе есть множество значений, полный список: imap_headerinfo

Для реальных сообщений обычный текст можно прочитать с помощью imap_body(), передав поток и номер требуемого сообщения (в $emails после вашего поиска). Получение html/multipart электронной почты немного сложнее. Сначала вам понадобится imap_fetchstructure(), который идентифицирует части сообщения, затем imap_fetchbody(), чтобы получить интересующую вас деталь.

Как только у вас есть результат от imap_fetchbody(), если вам все еще нужно настроить кодировку, это может быть сделано в этот момент.

Ответ 5

У меня была задача получать письма из определенного почтового ящика, анализировать их и индексировать определенный контент.

Я хотел иметь некоторый микросервис, который предоставил бы мне данные.

  • Загрузка необходимого содержимого
  • Преобразование полученных данных в читаемый формат
  • обрабатывать содержимое

Итак, я решил использовать готовые инструменты.

  • script для получения электронной почты - imap2maildir
  • Клиент Unix для обработки сообщений mu
  • dos2unix.

Затем я написал небольшой bash script, который я разместил в cron

#!/bin/bash
python /var/mail_dump/imap2maildir/imap2maildir -c /var/mail_dump/imap2maildir/deploy.conf
mu index --maildir=/var/mail_dump/dumps/new
#clean old data
rm -rf /var/mail_dump/extract/*

#search match messages
mu find jivo --fields="l" --nocolor | xargs $1 cp -t /var/mail_dump/extract
#converting
dos2unix -f /var/mail_dump/extract/*

#reassembly of messages in html
cd /var/mail_dump/extract/
for i in /var/mail_dump/extract/*
do
  mu extract --parts=0 --overwrite "$i"
  rm "$i"
done

Завершить! У меня есть служба, которая постоянно получает электронные письма и готовит их для обработки. php работает с подготовленными данными, не задумываясь о реализации низкоуровневой логики.