Как обрабатывать проиндексированные Google «страницы», которых на самом деле не существует?

  • Автор темы stenka1
  • 36
  • Обновлено
  • 16, May 2024
  • #1
Когда я ищу свой сайт в Google, используя оператор «сайт», я вижу множество страниц, проиндексированных в Google. На моем сайте всего 7 страниц. Но я вижу около 1860 результатов, и большинство из них содержат порнографические названия. Когда я ищу с помощью www (сайт:www.elliscreekconstruction.com

), я вижу идеальные 7 результатов. Когда я ищу с помощью «сайт: elliscreekconstruction.com», Я вижу, что URL всех проиндексированных страниц не содержат www. Если я нажму на эту ссылку, я увижу сообщение «Доступ запрещен». Если я просматриваю свой веб-сайт без использования www, например http://elliscreekconstruction.com

, я вижу то же сообщение «доступ запрещен». Если я напишу что-нибудь после корневого домена (например, http://elliscreekconstruction.com/anything

), я вижу то же самое сообщение «доступ запрещен» вместо страницы 404. Но если я напишу что-нибудь после корневого домена, используя www (например, http://www.elliscreekconstruction.com/anything

), я вижу страницу 404. И мой сайт хорошо работает с поддоменом www. Я не уверен, почему возникает такая проблема.

Как Google проиндексировал такое количество страниц, поскольку их на самом деле не существует? Я купил домен у Dreamhost и разместил свой сайт в Squarespace.

В Squarespace я использовал префикс www для своего домена. Я не знаю, как справиться с такой ситуацией.

Я использую этот домен последние три года.

На момент покупки домен не был просроченным. Как я могу решить эту проблему? Как я могу удалить эту неожиданную ссылку из Google? Если было от 5 до 10 ссылок, я могу удалить их из инструмента веб-мастера Google.

Но невозможно попросить Google удалить эти 1800 ссылок.

Кроме того, после выяснения этой проблемы я хочу перенаправить свой домен без www на свой домен www. Есть ли кто-нибудь, кто может мне помочь в этом вопросе?

Спасибо.

stenka1


Рег
27 Aug, 2012

Тем
1

Постов
3

Баллов
13
  • 29, May 2024
  • #2
Спасибо @sarahk и Скрытая информация :: Авторизуйтесь для просмотра »
Я связался с Squarespace, и они сказали мне, что конфигурация моего домена неверна, а затем я исправил это и удалил из этой настройки префикс www.

Теперь я могу просматривать свой сайт без www.

И если я просматриваю URL-адрес www, я перенаправляюсь на URL-адрес без www. Я разместил свой сайт в инструменте Google для веб-мастеров.

Я проверил домен как без www, так и с доменом www. Для обоих URL-адресов не обнаружено ручных действий по борьбе со спамом.

Я добавил URL-адрес без www всего несколько минут назад и теперь вижу, что всего 1929 проиндексировано для URL-адреса без www.

URL-адрес www они еще не обработали.

Я вижу 93 267 ошибок сканирования с отказом в доступе.

Имеется 20 карт сайта.

Я никого не подавал.

Должен ли я удалить их все? и добавить новую карту сайта? Как я могу удалить эти проиндексированные страницы?
 

likehell


Рег
20 Dec, 2013

Тем
0

Постов
3

Баллов
3
  • 03, Jun 2024
  • #3
Я бы начал с изменения того, как вы обрабатываете эти страницы. Возьми этот... вы выдаете ошибку 403, и это говорит о том, что контент существует, но у пользователя нет к нему доступа.

Я бы изменил это на 404 и перенаправил пользователя на правильное сообщение о недостающей странице.

Добавьте к этому правильную карту сайта в формате XML, зарегистрированную в инструментах Google для веб-мастеров, и установите для утвержденного сайта версию www, и должно пройти сообщение о том, что сайт больше не размещает этот контент.
 

Алексей Стоянов


Рег
15 Jan, 2013

Тем
1

Постов
4

Баллов
14
Тем
49554
Комментарии
57426
Опыт
552966

Интересно