Неверная ошибка Google 404 на индексной странице, которая работает нормально

У моего друга возникли проблемы с тем, что сайт был проиндексирован Google и попросил меня взглянуть, но это не то, о чем я действительно много знаю, и надеялся на некоторую помощь.

Глядя на свою консоль поиска, сканирование google показывает ошибку soft-404 на индексной странице. Я отметил это как исправленное несколько раз, потому что сайт выглядит хорошо для меня, но он продолжает возвращаться.

Если я забираю сайт как google, он, похоже, работает нормально, хотя на нем отображается мобильная версия вместо рабочего стола.

введите описание изображения здесь

Он продолжает давать еще один повтор 404 страницы http://www.smeyan.com/new-page, который не существует нигде, где я могу видеть, включая файлы сервера или файлы Sitemap.

Вот что я знаю об этом сайте:

Он был сайтом wix и был перемещен на общий сервер gator-сервера два месяца назад.

Он использует JavaScript/jQuery.load для получения содержимого страницы вне шаблона index.html.

В нем есть 2 файла Sitemap для URL и один для обоих URL-адресов и изображений http://www.smeyan.com/sitemap_url.xml http://www.smeyan.com/sitemap.xml

Прошло около двух месяцев с момента его отправки для индексирования, и Google не индексировал какой-либо контент при поиске сайта: www.smeyan.com показывает некоторые старые вещи с сервера wix. Хотя консоль поиска говорит, что индексировано 172 изображения.

у него есть www. как предпочтение, установленное в консоли поиска.

Кто-нибудь испытал это и имеет направление для исправления?

Ответ 1

Сколько времени было задано для этого сайта в заголовке Cache-Control? Если вы долгое время, вы должны использовать "удаление google" для устаревших фрагментов и кеша. Я смоделировал посещение Google на своей веб-странице. Исправьте код возврата 404. Правильные заголовки. Таким образом. Сообщайте об удалении google для "не найденных" страниц. Вы должны запросить посещение робота Google и сохранять спокойствие и ждать реакции.

BTW: для постоянно удаляемого контента используйте 410 Gone for Google или... отчет через Removals. https://support.google.com/webmasters/answer/1663419?hl=en

Ответ 2

Единственная ошибка загрузки, которую я видел при использовании функции Chrome Inspect, относится к тегу SCRIPT с URL-адресом Facebook в качестве файла источника (src).

Это ошибка, о которой сообщает Inspect. введите описание изображения здесь

Это тег SCRIPT, который вызвал ошибку. введите описание изображения здесь

Я не уверен, что это причина повторной ошибки 404, но это проблема, которая требует внимания на этом веб-сайте.

Ответ 3

Я проверил ваш сайт с помощью Tor Browser, который... DISABLED SCRIPTS. Вы должны предоставить любой контент на своем сайте с помощью тега <noscript/>. Это не должно быть красивым, но должно быть видно для ботов. <a href... ></a>, <img/> и т.д. и... ТЕКСТ. Без него сайт НЕ ОПТИМИЗИРОВАН для поиска ботов. Читайте о SEO. Содержимое sitemap не может быть проиндексировано, если контент никогда не будет связан.

Вероятно, ваша веб-страница также не соответствует требованиям для чтения с экрана (для слепых).

введите описание изображения здесь Примечание. Изображение с надписью "SMEYAN" отображается на веб-странице и индексируется.

второе изображение на веб-странице (в источнике): <img class="gallery-full-image" src="./galleries/home_gallery/smeyan_home-1.jpg" /> и индексированный

Меню также не работает без скриптов.

Я думал, что этот шаг хорош.

Используйте элемент <noscript/> и реализуйте версию для слепых (без скриптов, укажите тег alt для изображений) и для noscript-браузеров. Вы можете протестировать его, отключив script или через расширение NOSCRIPT для Firefox.

BTW. Вы должны использовать HTML, CSS (включая анимацию) и... использовать JS ONLY, если это необходимо. Или... <noscript/>.