Правильная версия файла robot.txt

  • Автор темы Mar$hall
  • 1597
  • Обновлено
  • 24, Apr 2016
  • #1
приветствую форумчан! Кучу материала перелопатил по этому вопросу и решил спросить об этом у знающих вебмастеров. Какой он все таки ПРАВИЛЬНЫЙ robot.txt для блога на wordpress ??

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
  • 24, Apr 2016
  • #2
Forstman:
приветствую форумчан!

Кучу материала перелопатил по этому вопросу и решил спросить об этом у знающих вебмастеров.
Какой он все таки ПРАВИЛЬНЫЙ robot.txt для блога на wordpress ??
Robots.txt это просто инструмент и не зависит от CMS. Все зависит от того, что именно вы хотите сообщить поисковикам. Все это делается в robots.txt Важный момент ИМХО - это конечно указать основной домен яндексу, а также карту сайта. Все остальное на усмотрение.
 

Флоппи


Рег
12 Jan, 2014

Тем
24

Постов
57

Баллов
297
  • 24, Apr 2016
  • #3
Зайдите на разные популярные блоги на вордпресс и смотрите как у них устроено. Сделайте выводы и применяйте к своему сайту.
 

Sutramana


Рег
17 Jan, 2014

Тем
0

Постов
29

Баллов
29
  • 24, Apr 2016
  • #4
Я в таких случаях так и делаю. Проверить cms сайта можно тут: 2ip.ru а robots.txt любого сайта можно посмотреть domen.com/robots.txt Ну и было бы неплохо прочитать руководства гугла и яндекса по настройке robots.txt
 

Sutramana


Рег
17 Jan, 2014

Тем
0

Постов
29

Баллов
29
  • 24, Apr 2016
  • #5
cms я указал лишь потому, что на нескольких ресурсах делали на этом акцент.
Все зависит от того, что именно вы хотите сообщить поисковикам
вот я и хочу узнать, что лучше показывать поисковикам, а что нельзя. Прочитал, например что гугл чуть ли не требует доступа к файлам шаблона, а яндекс может выругаться на это. Проблема в том, что все материалы которые я находил двухлетней и более давности.
 

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
  • 24, Apr 2016
  • #6
Зайдите на разные популярные блоги на вордпресс и смотрите как у них устроено. Сделайте выводы и применяйте к своему сайту.
и почему вы думаете, что я этого не сделал до того как написал на форуме?
 

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
  • 24, Apr 2016
  • #7
вот я и хочу узнать, что лучше показывать поисковикам, а что нельзя.
То что должно быть индексировано ( статьи и изображения ) надо сообщить.

Хотя достаточно адреса статей, картинки сам найдет гугл.

Остальное можно запретить.

Хотя это не обязательно.

А карту сайта можно добавить сразу в консоли яндекса и гугла.

Не обязательно сообщить в robots.txt, хотя не помешает.
 

Obitatelll


Рег
02 Feb, 2011

Тем
6732

Постов
9964

Баллов
77284
  • 24, Apr 2016
  • #8
Forstman:
и почему вы думаете, что я этого не сделал до того как написал на форуме?
Собственно я об этом вообще не думал. Какой смысл гадать? ))
 

Sutramana


Рег
17 Jan, 2014

Тем
0

Постов
29

Баллов
29
  • 24, Apr 2016
  • #9
User-agent: *

Allow: /wp-content/themes/frontend
Disallow: /wp-admin
Disallow: /wp-content
Disallow: /wp-includes
Disallow: /wp-comments
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: */trackback
Disallow: /xmlrpc.php
Disallow: */feed
Disallow: */author

User-agent: Googlebot-Image
Allow: /wp-content/uploads/

User-agent: YandexImages
Allow: /wp-content/uploads/
host: site.ru
Sitemap: https://site.ru/sitemap.xml

вот как один из вариантов, выделил жирным вторую строку, это папка с активной темой. Это если делать с учетом требований гугла
 

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
  • 24, Apr 2016
  • #10
User-agent: YandexImages
Allow: /wp-content/uploads/
host: site.ru
Sitemap: https://site.ru/sitemap.xml

Надо отделить YandexImages и Yandex
 User-agent: YandexImages
Allow: /wp-content/uploads/
User-agent: Yandex
host: site.ru
Sitemap: [url]https://site.ru/sitemap.xml[/url]
 

Флоппи


Рег
12 Jan, 2014

Тем
24

Постов
57

Баллов
297
  • 24, Apr 2016
  • #11
вот как один из вариантов, выделил жирным вторую строку, это папка с активной темой. Это если делать с учетом требований гугла
Там все нормально вроде бы, а Yandex и YandexImages разные боты. Их действительно нужно отделить, как указали выше.
 

Obitatelll


Рег
02 Feb, 2011

Тем
6732

Постов
9964

Баллов
77284
  • 24, Apr 2016
  • #12
Надо отделить YandexImages и Yandex

Код:
User-agent: YandexImages
Allow: /wp-content/uploads/

User-agent: Yandex
host: site.ru
Sitemap: https://site.ru/sitemap.xml

т.е. хотите сказать что акцент на картинки не обязательно делать?
 

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
  • 24, Apr 2016
  • #13
ну видимо, для бота yandex действует общее условие, а для YandexImages отдельное. я еще плохо в этом разбираюсь
 

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
  • 24, Apr 2016
  • #14
т.е. хотите сказать что акцент на картинки не обязательно делать?
Ну в той части, где Вы разрешили боту Yandex Images индексировать указанную директорию, Вы тем самым сообщили нужному боту где искать картинки.
 

Obitatelll


Рег
02 Feb, 2011

Тем
6732

Постов
9964

Баллов
77284
  • 24, Apr 2016
  • #15
Forstman:
ну видимо, для бота yandex действует общее условие, а для YandexImages отдельное. я еще плохо в этом разбираюсь
Дело не только в условиях, а в том, что yandex images индексирует только картинки. А основной бот остальное.
 

Obitatelll


Рег
02 Feb, 2011

Тем
6732

Постов
9964

Баллов
77284
  • 24, Apr 2016
  • #16
В общем решил остановиться на таком варианте
User-agent: *
Allow: /wp-content/themes/newsanchor/
Allow: /wp-content/plugins/
Allow: /wp-includes/js/
Allow: /wp-content/uploads/
Disallow: /wp-admin
Disallow: /wp-content
Disallow: /wp-includes
Disallow: /wp-comments
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: */trackback
Disallow: /xmlrpc.php
Disallow: */feed
Disallow: */author

host: site.ru

Sitemap: https://site.ru/sitemap.xml

 

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
  • 24, Apr 2016
  • #17
В общем решил остановиться на таком варианте
host: понимает только Яндекс, лучше бы указать специально для Яндекс Бота. Хотя и так должно работать.
 

Obitatelll


Рег
02 Feb, 2011

Тем
6732

Постов
9964

Баллов
77284
  • 24, Apr 2016
  • #18
В общем решил остановиться на таком варианте
host: понимает только Яндекс, лучше бы указать специально для Яндекс Бота. Хотя и так должно работать.
тоже решил что и так должно работать
 

Mar$hall


Рег
12 Feb, 2016

Тем
2

Постов
10

Баллов
30
Тем
49554
Комментарии
57426
Опыт
552966

Интересно